摘要:
Matplotlib Matplotlib is the grandfather of python visualization packages. It is extremely powerful but with that power comes complexity.强大但相对复杂 Seabo 阅读全文
摘要:
为啥a有4个策略而b有3个策略? 看到下面(树->矩阵)这个就了然了: 强化学习的根本目的在于最大化奖励【optimize your long term expected reward(获得更多的奖励)】 MiniMAx 假设所有人都在寻求最优,达到最大化奖励 来吧,再加点不确定性进来~~愉快的玩耍 阅读全文