《机器学习十讲》第十讲 强化学习
一、马尔可夫决策过程MDP
二、基于价值的方法
Q-Learning
DQN
三、基于策略的方法
策略梯度算法
四、总结
机器学习——》微积分 、概率论、优化方法、统计学
——》python、数据结构、数据库
数据采集、数据管理、数据清洗、数据可视化
深度学习、强化学习
NLP、网络分析。。。。。
与相应行业结合
学习建议