2020年8月1日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 我们提出了一种基于情绪的分层强化学习(HRL)算法,用于具有多种奖励来源的环境。该系统的架构受到大脑神经生物学的启发,特别是负责情绪,决策和行为执行的区域,分别是杏仁核,眶额皮质和基底神经节。学习问题根据奖励的来源而分解 阅读全文
posted @ 2020-08-01 14:00 穷酸秀才大草包 阅读(508) 评论(0) 推荐(0)

导航