凯鲁嘎吉
用书写铭记日常,最迷人的不在远方
摘要: 凯鲁嘎吉的主页 凯鲁嘎吉的主页:kailugaji.github.io 或扫描下方二维码,即可查看 阅读全文
posted @ 2022-03-05 11:21 凯鲁嘎吉 阅读(717) 评论(0) 推荐(0) 编辑
摘要: 强化学习(Reinforcement Learning) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《神经网络与深度学习》及其他资料,了解强化学习(Reinforcement Learning)的基本知识,并介绍相关强化学习算法。更多强化 阅读全文
posted @ 2021-09-29 21:19 凯鲁嘎吉 阅读(3157) 评论(1) 推荐(7) 编辑
摘要: 纪念第一个Pytorch/TensorFlow程序 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 截止今日,写了17篇有关Deep Learning的博文,如下所示 没想到吧,我的电脑连Python都没安装,之前一直用的Notepad++看的程序 说 阅读全文
posted @ 2021-08-16 10:06 凯鲁嘎吉 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 英文学术论文写作常用词句积累 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 英文学术论文写作常用词句,避免查重率高的小技巧——同义词替换。推荐网站:https://www.powerthesaurus.org 本文使用方法:按Ctrl+F, 搜一个想 阅读全文
posted @ 2021-03-16 22:47 凯鲁嘎吉 阅读(2847) 评论(0) 推荐(1) 编辑
摘要: LaTeX常用链接与资料 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 1. 软件安装 LaTex 论文排版(1): Win10 下 LaTex所需软件安装 (Tex live 2018 + Tex studio)_TechArtisan6的博客-C 阅读全文
posted @ 2020-07-20 21:01 凯鲁嘎吉 阅读(1153) 评论(0) 推荐(1) 编辑
摘要: Safe RL——Constrained Policy Optimization (CPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇文章详细讲解Constrained Policy Optimization (CPO)的公式推导,文献来自 阅读全文
posted @ 2022-11-19 10:44 凯鲁嘎吉 阅读(39) 评论(0) 推荐(0) 编辑
摘要: Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 强化学习可以看作为概 阅读全文
posted @ 2022-09-04 10:44 凯鲁嘎吉 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 最优化——无约束最优化方法(Unconstrained Optimization Algorithms) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的无约束优化方法,包括:线搜索法、信赖域法、以及最小二乘法。更多优 阅读全文
posted @ 2022-08-09 20:51 凯鲁嘎吉 阅读(338) 评论(0) 推荐(1) 编辑
摘要: 最优化——约束优化方法(Constrained Optimization Algorithms) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的约束优化方法,包括:直接搜索法(随机方向法、约束坐标轮换法、复合形法、以 阅读全文
posted @ 2022-08-09 20:17 凯鲁嘎吉 阅读(433) 评论(0) 推荐(0) 编辑
摘要: MATLAB聚类有效性评价指标(内部) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 外部评价指标(需要真实标签),请看:MATLAB聚类有效性评价指标(外部),MATLAB聚类有效性评价指标(外部 成对度量) MATLAB中有一个聚类内部评价指标的 阅读全文
posted @ 2022-04-20 14:45 凯鲁嘎吉 阅读(2018) 评论(0) 推荐(0) 编辑
摘要: 《Easy RL》面试题汇总 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本博客汇总了蘑菇书《Easy RL》强化学习中文教程涉及的面试题及答案(v.1.0.3)。强化学习介绍可参看:强化学习(Reinforcement Learning) - 凯 阅读全文
posted @ 2022-04-13 16:22 凯鲁嘎吉 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 离线强化学习(A Survey on Offline Reinforcement Learning) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《A Survey on Offline Reinforcement Learning: Ta 阅读全文
posted @ 2022-03-22 17:18 凯鲁嘎吉 阅读(835) 评论(4) 推荐(3) 编辑
摘要: 凯鲁嘎吉的主页 凯鲁嘎吉的主页:kailugaji.github.io 或扫描下方二维码,即可查看 阅读全文
posted @ 2022-03-05 11:21 凯鲁嘎吉 阅读(717) 评论(0) 推荐(0) 编辑
摘要: Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning - 阅读全文
posted @ 2022-02-28 16:32 凯鲁嘎吉 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 动态规划(Dynamic Programming, DP) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bell 阅读全文
posted @ 2022-02-26 09:36 凯鲁嘎吉 阅读(168) 评论(0) 推荐(0) 编辑