摘要:强化学习基本要素
马尔科夫决策过程
策略学习(Policy Learning)
时序差分方法(TD method)
Q-Learning算法
Actor-Critic方法
DQN
DDPG
推荐系统强化学习建模
附录
阅读全文
posted @ 2019-10-13 11:58
混沌战神阿瑞斯
阅读(710)
推荐(0)
编辑
摘要:推荐系统上线的基本条件
AB实验
功能列表
数据指标
覆盖率
AUC及gAUC
指标展示
指标监控
人工评测
附录
阅读全文
posted @ 2019-10-13 11:57
混沌战神阿瑞斯
阅读(768)
推荐(1)
编辑