摘要: > 目 录 < k-armed bandit problem Incremental Implementation Tracking a Nonstationary Problem Initial Values (*) Upper-Confidence-Bound Action Selection( 阅读全文
posted @ 2018-10-22 14:02 不吃腊肉的猫 阅读(559) 评论(0) 推荐(0)
摘要: > 目 录 < learning & intelligence 的基本思想 RL的定义、特点、四要素 与其他learning methods、evolutionary methods的比较 例子(井字棋 tic-tac-toe)及早期发展史 > 笔 记 < learning & intelligen 阅读全文
posted @ 2018-10-22 14:02 不吃腊肉的猫 阅读(598) 评论(0) 推荐(0)