摘要:**发表时间:**2007(science) **文章要点:**这篇文章主要说checkers已经被解决了,得出的结论是如果两边都不犯错的话,这个游戏的最终结果是平局(Perfect play by both sides leads to a draw)。Solve其实有三种含义,ultraweak
阅读全文
摘要:**发表时间:**2021(ICML 2021) **文章要点:**这篇文章提出了一个叫REPresentation And INstance Transfer (REPAINT)的算法来做RL里的知识迁移。主要方法就是representation transfer和instance transfe
阅读全文