摘要:
强化学习基本要素
马尔科夫决策过程
策略学习(Policy Learning)
时序差分方法(TD method)
Q-Learning算法
Actor-Critic方法
DQN
DDPG
推荐系统强化学习建模
附录 阅读全文
posted @ 2019-10-13 11:58
混沌战神阿瑞斯
阅读(1522)
评论(0)
推荐(0)
摘要:
推荐系统上线的基本条件
AB实验
功能列表
数据指标
覆盖率
AUC及gAUC
指标展示
指标监控
人工评测
附录 阅读全文
posted @ 2019-10-13 11:57
混沌战神阿瑞斯
阅读(1713)
评论(0)
推荐(1)

浙公网安备 33010602011771号