2018 年 7月 18 日随笔档案 - 吴春旭

摘要：转载申明：最近在看AlphaGo的原理，刚好在https://blog.csdn.net/a1805180411/article/details/51155164发现了这篇文章，感觉写的非常好，好东西就要分享，所以转载过来供大家学习。以下是转载全文。导读：关于Alf... 阅读全文

posted @ 2018-07-18 22:07 吴春旭阅读(13197) 评论(1) 推荐(1) 编辑

摘要： Deep Learning的常用模型或者方法 1、AutoEncoder自动编码器 Deep Learning最简单的一种方法是利用人工神经网络的特点，人工神经网络（ANN）本身就是具有层次结构的系统，如果给定一个神经网络，我们假设其输出与输入是相同的... 阅读全文

posted @ 2018-07-18 21:54 吴春旭阅读(5875) 评论(0) 推荐(0) 编辑

摘要：强化学习是一个连续决策的过程，传统的机器学习中的有监督学习是给定一些标注数据，学习一个好的函数，对未知数据做出很好的决策。但有时候，并不知道标注是什么，即一开始不知道什么是“好”的结果，所以RL不是给定标注，而是给一个回报函数，这个回报函数决定当前状态得到... 阅读全文

posted @ 2018-07-18 21:44 吴春旭阅读(4772) 评论(0) 推荐(0) 编辑

吴春旭