摘要: [TOC] ML Agents(五)GridWorld GridWorld这个例子比较有意思,它还是运用了Reinforcement Learning来进行学习的,不同的是它运用了视觉观察值(Visual Observations)来训练agent。 如上图所示,Agent就是蓝色的方块,每次它可 阅读全文
posted @ 2020-04-05 21:22 煦阳 阅读(3648) 评论(8) 推荐(0) 编辑
摘要: [TOC]  ML Agents(四)3DBall补充の引入泛化 前两天大概研究完3DBall示例,里面的初始化中运用了如下代码: 这里面的 m_ResetParams 参数初始化让我没明白到底是干啥用的,今天翻官方文档才发现这里参数的意义,简单来讲其实这里是为了训练出可以适应环境改变的Agent 阅读全文
posted @ 2020-03-31 00:05 煦阳 阅读(1659) 评论(2) 推荐(1) 编辑
摘要: [TOC]  ML Agents(三)3DBall例子 前一周忙着公司的考试,都没有怎么学新的,今天补上~ 之后的记录,我准备先只研究官方的示例,主要是把研究过程中的疑惑和想法记下来。首先我先补充一下如何利用GPU进行训练,结合(一)中的安装方法,需要CUDA v10.0,cuDNN v7.6.5 阅读全文
posted @ 2020-03-29 00:51 煦阳 阅读(2324) 评论(1) 推荐(1) 编辑
摘要: [TOC] ML Agents(二)创建一个学习环境 一、前言 上一节我们讲了如何配置ML Agents环境,这一节我们创建一个示例,主要利用Reinforcement Learning(强化学习)。 如上图,本示例将训练一个球滚动找到随机放置的立方体,而且要避免从平台上掉下去。 本示例是基于ML 阅读全文
posted @ 2020-03-16 22:51 煦阳 阅读(5398) 评论(3) 推荐(4) 编辑
摘要: [TOC] 一、背景 作为机械狗转行,数据结构当然是不可缺少的,疫情假期里闲来在家无事,刚好接下给小孩教数据结构的活,所以自学了简单的数据结构用法,算是数据结构的入门吧。做个笔记记下来,其实平常喜欢用思维导图进行记录,这算复习一遍,所以再用MarkDown进行记录,顺便发个博。 话不多说,今天先来记 阅读全文
posted @ 2020-03-15 18:02 煦阳 阅读(751) 评论(0) 推荐(0) 编辑
摘要: [20200318更新]注意:之前关于下载CUDA与cuDNN的版本我写错了,首先道个歉。如果要想用Tensorflow利用GPU进行训练,就需要Tensorflow、CUDA、cuDNN的版本对应一致。之前我弄错了!我们后面用的Tensorflow的版本是2.0.1,所以对应CUDA的版本应该是C 阅读全文
posted @ 2020-03-09 22:57 煦阳 阅读(5971) 评论(7) 推荐(6) 编辑