摘要: 15:49 2025.12.28 目的:完成蒙特卡洛树搜索 把所有环境 Go, goEnv 和 demo(dqn_vs_random_demo)丢给 ai,让它生成一个 mcts 训练代码。 这个 mcts 不太对劲,为什么 rollout 看起来很不随机啊。 10:47 2025.12.24 目的 阅读全文
posted @ 2025-12-22 11:59 哼唧昂叽 阅读(34) 评论(0) 推荐(0)