摘要: 序幕 童年经典游戏 80、90年代出生的人,红白机总是童年时光重要的记忆片段之一。几叠游戏盒,两个手柄,就可以开启一整天的欢乐时光,乐此不疲地探索各种红白机游戏中的玩法、机制、彩蛋。虽然只是2维平面上的像素头小人,虽然只是“上上下下左右左右BABA”这般的简单按键,但依然被玩家们开发出了各种精彩纷呈 阅读全文
posted @ 2022-12-01 15:12 OpenDILab 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 引言:为什么 Transformer 在 RL 上不 work Transformer 最早发源于自然语言处理领域(NLP),以一个非常惊人的标题 “Attention is All You Need” 催生了无数后续工作,而 Transformer 最近的一些变体已经在 NLP 领域证明了其可以在 阅读全文
posted @ 2022-08-30 21:49 OpenDILab 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 引言 探索和利用的平衡 (The banlance between exploration and exploitation) 是强化学习中最核心的问题之一。 一般来说,利用指的是利用当前已知知识做出最优动作,探索指的是探索未知的环境以获取新的知识,从而潜在地可能得到回报更大的动作。探索与利用如何平 阅读全文
posted @ 2022-08-25 12:05 OpenDILab 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 引言 如果想要将强化学习技术应用在某个决策领域,最重要的就是将原始问题转换为一个合理的 MDP (马尔科夫决策过程)问题,而一旦问题环境本身有一些不那么友好的”特性“(比如部分可观测,非平稳过程等等),常规强化学习方法的效果便可能大打折扣。另一方面,随着近些年来数据驱动范式的发展,大数据和预训练大模 阅读全文
posted @ 2022-08-16 10:56 OpenDILab 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 介绍一下OpenDILab团队最新提出的自动驾驶策略InterFuser(Interpretable Sensor Fusion Transformer)。该策略基于Transformer进行多传感器融合的和使用可解释性特征增加自动驾驶的安全性,在最新的CARLA Leaderboard排行榜中取得 阅读全文
posted @ 2022-08-09 21:45 OpenDILab 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 2022年5月28日,OpenDILab举办了全球首届“AI球球大作战:Go-Bigger多智能体决策智能挑战赛”(以下简称“Go-Bigger决策智能挑战赛”)线上颁奖典礼及Workshop。 经过半年多的激烈角逐,最终有6支队伍从近1500支队伍中脱颖而出,获得15万赛事奖金。 比赛共设冠军、亚 阅读全文
posted @ 2022-07-21 19:40 OpenDILab 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 在当今信息大爆炸的时代,人们已越来越多地习惯用视频的形式传达信息,在Youtube上每分钟就有超过300小时的视频上传。而且在媒介形式中,视频相较于图片有着更大的使用场景和应用范围。自动识别这些海量视频中的人类行为、事件、紧急情况等内容,对于视频推荐、监控预警等实际应用具有重要意义。近年来,已有很多 阅读全文
posted @ 2022-07-12 21:01 OpenDILab 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 引言 自动驾驶领域近几年来一直备受关注,但截止目前,自动驾驶在现实复杂场景下的大规模部署应用却一再延后。 其中一个很重要的原因是,目前业界对于动态和强交互性场景下的行为、轨迹预测问题(behavior prediction)始终没有得出很好的解决方案。缺乏对其他道路参与者的行为理解与预测,自动驾驶车 阅读全文
posted @ 2022-07-04 16:17 OpenDILab 阅读(504) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事。但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真事。 这位讲AI的主播,就是那个《星际争霸2》的虫王——IA。 然后,他讲AI的画风是这样的: 但有一说一,讲AI毕竟还是一件严谨的事儿。IA的这波 阅读全文
posted @ 2022-06-27 10:43 OpenDILab 阅读(295) 评论(0) 推荐(0) 编辑