摘要: 强化学习基本要素 马尔科夫决策过程 策略学习(Policy Learning) 时序差分方法(TD method) Q-Learning算法 Actor-Critic方法 DQN DDPG 推荐系统强化学习建模 附录 阅读全文
posted @ 2019-10-13 11:58 混沌战神阿瑞斯 阅读(1267) 评论(0) 推荐(0) 编辑
摘要: 推荐系统上线的基本条件 AB实验 功能列表 数据指标 覆盖率 AUC及gAUC 指标展示 指标监控 人工评测 附录 阅读全文
posted @ 2019-10-13 11:57 混沌战神阿瑞斯 阅读(1303) 评论(0) 推荐(1) 编辑