2019 年 10月 13 日随笔档案 - 混沌战神阿瑞斯

摘要：强化学习基本要素马尔科夫决策过程策略学习(Policy Learning) 时序差分方法（TD method） Q-Learning算法 Actor-Critic方法 DQN DDPG 推荐系统强化学习建模附录阅读全文

posted @ 2019-10-13 11:58 混沌战神阿瑞斯阅读(1267) 评论(0) 推荐(0) 编辑

摘要：推荐系统上线的基本条件 AB实验功能列表数据指标覆盖率 AUC及gAUC 指标展示指标监控人工评测附录阅读全文

posted @ 2019-10-13 11:57 混沌战神阿瑞斯阅读(1303) 评论(0) 推荐(1) 编辑

混沌战神阿瑞斯