会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
凯鲁嘎吉
用书写铭记日常,最迷人的不在远方
博客园
首页
新随笔
新文章
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
30
下一页
2021年11月1日
强化学习相关资料(书籍,课程,网址,笔记等)
摘要: 强化学习相关资料(书籍,课程,网址,笔记等) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning - 随笔分类 - 凯鲁嘎吉 - 博客园 https://www.cnblogs.com/kailuga
阅读全文
posted @ 2021-11-01 16:14 凯鲁嘎吉
阅读(2096)
评论(0)
推荐(1)
编辑
2021年10月21日
双层优化问题:统一GAN,演员-评论员与元学习方法(Bilevel Optimization Problem unifies GAN, Actor-Critic, and Meta-Learning Methods)
摘要: 双层优化问题:统一GAN,演员-评论员与元学习方法 (Bilevel Optimization Problem unifies GAN, Actor-Critic, and Meta-Learning Methods) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kai
阅读全文
posted @ 2021-10-21 13:15 凯鲁嘎吉
阅读(4469)
评论(2)
推荐(1)
编辑
2021年10月19日
COMPLETER: 基于对比预测的缺失视图聚类方法
摘要: COMPLETER: 基于对比预测的缺失视图聚类方法 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本文对COMPLETER: Incomplete Multi-view Clustering via Contrastive Prediction这篇
阅读全文
posted @ 2021-10-19 16:43 凯鲁嘎吉
阅读(1792)
评论(1)
推荐(0)
编辑
2021年10月13日
重要性采样(Importance Sampling)——TRPO与PPO的补充
摘要: 重要性采样(Importance Sampling)——TRPO与PPO的补充 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 上两篇博客已经介绍了信赖域策略优化(Trust Region Policy Optimization, TRPO)与近端策略
阅读全文
posted @ 2021-10-13 11:32 凯鲁嘎吉
阅读(1391)
评论(0)
推荐(2)
编辑
2021年10月12日
近端策略优化算法(Proximal Policy Optimization Algorithms, PPO)
摘要: 近端策略优化算法(Proximal Policy Optimization Algorithms, PPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇博文是Schulman, J., Wolski, F., Dhariwal, P., Ra
阅读全文
posted @ 2021-10-12 09:54 凯鲁嘎吉
阅读(2359)
评论(0)
推荐(0)
编辑
2021年10月10日
信赖域策略优化(Trust Region Policy Optimization, TRPO)
摘要: 信赖域策略优化(Trust Region Policy Optimization, TRPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇博文是John S., Sergey L., Pieter A., Michael J., Philip
阅读全文
posted @ 2021-10-10 13:31 凯鲁嘎吉
阅读(1715)
评论(0)
推荐(1)
编辑
2021年9月29日
强化学习(Reinforcement Learning)
摘要: 强化学习(Reinforcement Learning) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《神经网络与深度学习》及其他资料,了解强化学习(Reinforcement Learning)的基本知识,并介绍相关强化学习算法。更多强化
阅读全文
posted @ 2021-09-29 21:19 凯鲁嘎吉
阅读(5334)
评论(1)
推荐(8)
编辑
生成对抗网络(GAN与W-GAN)
摘要: 生成对抗网络(GAN与W-GAN) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《神经网络与深度学习》,了解生成对抗网络(Generative Adversarial Networks,GAN)的来龙去脉,并介绍GAN与Wasserstei
阅读全文
posted @ 2021-09-29 14:42 凯鲁嘎吉
阅读(930)
评论(0)
推荐(0)
编辑
2021年9月10日
卷积神经网络CNN
摘要: 卷积神经网络CNN 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 卷积神经网络(Convolutional Neural Network,CNN 或ConvNet)是一种具有局部连接、权重共享等特性的深层前馈神经网络。卷积神经网络最早主要是用来处理图
阅读全文
posted @ 2021-09-10 16:45 凯鲁嘎吉
阅读(628)
评论(0)
推荐(1)
编辑
2021年9月9日
循环神经网络RNN
摘要: 循环神经网络RNN 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 在前馈神经网络中,信息的传递是单向的,这种限制虽然使得网络变得更容易学习,但在一定程度上也减弱了神经网络模型的能力,在生物神经网络中,神经元之间的连接关系要复杂得多,前馈神经网络可以看
阅读全文
posted @ 2021-09-09 16:06 凯鲁嘎吉
阅读(208)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
8
9
···
30
下一页