摘要:
一、强化学习的主要构成 强化学习主要由两部分组成:智能体(agent)和环境(env)。在强化学习过程中,智能体与环境一直在交互。智能体在环境里面获取某个状态后,它会利用该状态输出一个动作(action)。然后这个动作会在环境之中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来 阅读全文
posted @ 2023-04-13 23:00
Bai_Er
阅读(1247)
评论(0)
推荐(0)
摘要:
还没想好怎么介绍自己 阅读全文
posted @ 2023-04-13 22:16
Bai_Er
阅读(11)
评论(0)
推荐(0)
摘要:
还没想好捏 阅读全文
posted @ 2023-04-13 22:16
Bai_Er
阅读(4)
评论(0)
推荐(0)

浙公网安备 33010602011771号