会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
哆啦哆啦
博客园
首页
新随笔
联系
订阅
管理
01 2023 档案
用模仿学习来学习POMDP中的信念表示
摘要:一、研究对象 本文研究了POMDP的模仿学习问题,具体来说本文在POMDP中引入了一种的信念表示学习方法,用于生成对抗模仿学习,不同于以往单独训练信念模块和策略,我们对信念模块和策略进行联合学习,使用任务感知模仿损失来确保目标表示更加符合策略目标。 为了避免这种潜在的信念退化,我们引入了集中信息性的
阅读全文
posted @
2023-01-15 14:03
哆啦哆啦呦
阅读(365)
评论(0)
推荐(0)
公告