上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 271 下一页

2019年3月10日

摘要: 这个是平时在实验室讲reinforcement learning 的时候用到PPT, 交期末作业、汇报都是一直用的这个,觉得比较不错,保存一下,也为分享,最早该PPT源于师弟汇报所做。 阅读全文
posted @ 2019-03-10 15:31 Angry_Panda 阅读(2335) 评论(0) 推荐(1)
摘要: 最近在学习强化学习的东西,在网上发现了一个关于DQN讲解的PPT,感觉很是不错,这里做下记录,具体出处不详。 阅读全文
posted @ 2019-03-10 13:15 Angry_Panda 阅读(769) 评论(0) 推荐(0)

2019年3月6日

摘要: 强化学习基础: 注: 在强化学习中 奖励函数和状态转移函数都是未知的,之所以有已知模型的强化学习解法是指使用采样估计的方式估计出奖励函数和状态转移函数,然后将强化学习问题转换为可以使用动态规划求解的已知模型问题。 强化学习问题由于采用了MDP数学形式来构建的,由此贝尔曼方程式是我们最常用的,如下: 阅读全文
posted @ 2019-03-06 22:11 Angry_Panda 阅读(2094) 评论(0) 推荐(0)

2019年3月1日

摘要: 今天在博客园上看了两篇博客,感觉还是蛮受启发,学习到了不少东西,这两篇博客分别是: A: 佳文赏析:《游戏使人上瘾的因素》 B: 从事游戏行业也有10年,让我来说下游戏的本质,为什么上瘾 其实是在博客园的首页上看到了A博客, A博客批评B博客,乍一感觉是A在说B是乱说,细一看感觉这两篇博客的出发点是 阅读全文
posted @ 2019-03-01 16:18 Angry_Panda 阅读(247) 评论(0) 推荐(0)
摘要: 这是今天中午开大会的记录,也是记录实验室生活的一些点滴吧,而且这也确实不易,因为毕竟一年也见不到几次老师,今天有幸得见,真心难得,于此同时也不禁感慨现如今学校生活的变态,学术环境的畸形。这学期要求交两次小论文,感觉算是小压力不过想想也还好,毕竟呆了快二年,做些事情还是好的,虽然被老板罚了一年的冷板凳 阅读全文
posted @ 2019-03-01 13:34 Angry_Panda 阅读(217) 评论(0) 推荐(0)

2019年2月28日

摘要: 原文地址: https://arxiv.org/pdf/1811.07871.pdf 如何让AI依照人类的意图行事?这是将AI应用于现实世界复杂问题的最大障碍之一。 DeepMind将这个问题定义为“智能体对齐问题”,并提出了新的解决方案。 概述了解决agent alignment问题的研究方向。所 阅读全文
posted @ 2019-02-28 09:26 Angry_Panda 阅读(1591) 评论(0) 推荐(0)

2019年2月26日

摘要: 最近师弟在做DQN的实验,由于是强化学习方面的东西,正好和我现在的研究方向一样于是我便帮忙跑了跑实验,于是就有了今天的这个内容。 首先在github上进行搜寻,如下图: 发现第一个星数最多,而且远高于其它的项目,于是拉取这个链接: https://github.com/devsisters/DQN- 阅读全文
posted @ 2019-02-26 12:02 Angry_Panda 阅读(3390) 评论(6) 推荐(0)

2019年2月25日

摘要: 新拿到一台服务器后我们一般都是要新建用户组,用户,并为其分配权限。 赋予用户组sudo权限: 首先,看一下如何为用户组分配sudo权限: 打开配置文件: sudo vim /etc/sudoers 可以看到: 这个是最原始的配置文件。 假设系统里面有用户组名为 wisd , 我们需要为该用户组下面的 阅读全文
posted @ 2019-02-25 19:36 Angry_Panda 阅读(8149) 评论(0) 推荐(0)
摘要: 这个题目有点攻击性的意思,看的人不大舒服。最开始的时候,我题目在《反对孩子学人工智能》、《坚决反对孩子学人工智能》之间犹豫。后来一想,是否攻击性过强,于是妥协一下,准备把题目拟为《孩子是否学人工智能须斟酌》。最后还是觉得,如此不鲜明的题目不是我的风格,索性把话都说出来,于是拟了这么个标题。我曾经多次 阅读全文
posted @ 2019-02-25 15:13 Angry_Panda 阅读(273) 评论(1) 推荐(0)

2019年2月7日

摘要: 做科研工作的人估计都是要用到Google学术的吧,由于大家众所周知的原因需要用到网络代理软件,比较好用的就是shadowsocks,主要原因是该软件提供加密技术,在一定程度上可以保证运行的稳定性,以往的代理软件由于没有使用加密技术所以很难保证长时间的有效运行,常常会用着用着就发现进黑名单了,而使用s 阅读全文
posted @ 2019-02-07 08:15 Angry_Panda 阅读(14) 评论(0) 推荐(0)
上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 271 下一页

导航