摘要:
> 目 录 < k-armed bandit problem Incremental Implementation Tracking a Nonstationary Problem Initial Values (*) Upper-Confidence-Bound Action Selection( 阅读全文
posted @ 2018-10-22 14:02
不吃腊肉的猫
阅读(559)
评论(0)
推荐(0)
摘要:
> 目 录 < learning & intelligence 的基本思想 RL的定义、特点、四要素 与其他learning methods、evolutionary methods的比较 例子(井字棋 tic-tac-toe)及早期发展史 > 笔 记 < learning & intelligen 阅读全文
posted @ 2018-10-22 14:02
不吃腊肉的猫
阅读(598)
评论(0)
推荐(0)

浙公网安备 33010602011771号