摘要: 转载申明:最近在看AlphaGo的原理,刚好在https://blog.csdn.net/a1805180411/article/details/51155164发现了这篇文章,感觉写的非常好,好东西就要分享,所以转载过来供大家学习。以下是转载全文。 导读:关于Alf... 阅读全文
posted @ 2018-07-18 22:07 吴春旭 阅读(13197) 评论(1) 推荐(1) 编辑
摘要: Deep Learning的常用模型或者方法 1、AutoEncoder自动编码器 Deep Learning最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,我们假设其输出与输入是相同的... 阅读全文
posted @ 2018-07-18 21:54 吴春旭 阅读(5875) 评论(0) 推荐(0) 编辑
摘要: 强化学习是一个连续决策的过程,传统的机器学习中的有监督学习是给定一些标注数据,学习一个好的函数,对未知数据做出很好的决策。但有时候,并不知道标注是什么,即一开始不知道什么是“好”的结果,所以RL不是给定标注,而是给一个回报函数,这个回报函数决定当前状态得到... 阅读全文
posted @ 2018-07-18 21:44 吴春旭 阅读(4772) 评论(0) 推荐(0) 编辑