摘要: 这里是第一个公式 $ F = ma^2 $ \[ \text{Reinforcement Learning} \doteq \pi_* \\ \quad \updownarrow \\ \pi_* \doteq \{ \pi(s) \}, \ s \in \mathcal{S} \\ \quad \ 阅读全文
posted @ 2017-10-29 21:34 陈峰 阅读(176) 评论(0) 推荐(0)