学习进度笔记25 - 嘻嘻_嘻 - 博客园

学习进度笔记25

《机器学习十讲》第十讲强化学习

一、马尔可夫决策过程MDP

二、基于价值的方法

Q-Learning

DQN

三、基于策略的方法

策略梯度算法

四、总结

机器学习——》微积分、概率论、优化方法、统计学

——》python、数据结构、数据库

数据采集、数据管理、数据清洗、数据可视化

深度学习、强化学习

NLP、网络分析。。。。。

与相应行业结合

学习建议

posted on 2021-02-05 19:28 嘻嘻_嘻阅读(62) 评论(0) 收藏举报

刷新页面返回顶部