09 2021 档案

强化学习中仿真环境下大规模并行采样的可行性分析——以仿真环境为例
摘要:强化学习中仿真环境下大规模并行采样的可行性分析——以视频游戏为例 仿真环境下大规模并行采样,顾名思义,就是同时并行化运行多个仿真环境并从其进行数据采样、交互等操作,仿真环境的运行基本可以分为CPU上运行和GPU上运行两种,在CPU上运行仿真运行的比较熟悉的有atari游戏的atari_py模块+gy 阅读全文

posted @ 2021-09-28 18:39 Angry_Panda 阅读(388) 评论(0) 推荐(0)

pycuda学习过程中的一些发现,cuda函数的初始化要在cuda内存空间初始化之后,否则会报错
摘要:参考: https://www.cnblogs.com/devilmaycry812839668/p/15348610.html 最近在看WarpDrive的代码,其中cuda上运行的代码是使用pycuda库进行连通的,使用pycuda可以很好的在python环境中调用cuda的代码,但是在使用中发 阅读全文

posted @ 2021-09-28 18:07 Angry_Panda 阅读(927) 评论(0) 推荐(0)

WarpDrive 教程 第一部分修改版
摘要:本文参考: https://www.cnblogs.com/devilmaycry812839668/p/15327509.html warpDrive是一个python库,目的是使用GPU并行运行多个仿真环境,现在支持的仿真环境还是比较简单和单一的,现在可以使用的仿真游戏为 tag 游戏。 同时, 阅读全文

posted @ 2021-09-28 16:34 Angry_Panda 阅读(227) 评论(0) 推荐(0)

孟晚舟即将回到祖国 —— 为强大的祖国而自傲和努力
摘要:孟晚舟即将回到祖国,而这一切离不开强大祖国的支撑,而这一消息又无疑不是在振奋国人,为此我以有如此强大祖国而自傲,与此同时我们也更应该知道强大祖国是离不开国人的努力建设的,为此我辈更应该加倍努力,让我们伟大的祖国更加强大、繁荣和富强。 阅读全文

posted @ 2021-09-25 12:26 Angry_Panda 阅读(101) 评论(1) 推荐(0)

【转载】 【WarpDrive】GPU加速RL: 一块V100运行上千个智能体、数千个环境,这个「曲率引擎」框架实现RL百倍提速
摘要:原文地址: https://mp.weixin.qq.com/s/Vw39k2PteEIGLRhmh2raLQ 官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/文章来源: 机器之心排版:OpenDeepRL 在强化学习研究 阅读全文

posted @ 2021-09-23 21:22 Angry_Panda 阅读(568) 评论(0) 推荐(0)

让爱国不停留于口号,让爱国变得更加铿锵有力——《1950他们正年轻》爱国题材记录电影的观影呼吁
摘要:爱国主义不应该只停留于口号,爱国主义应该更加铿锵有力。《1950他们正年轻》是一部极为少见极好的爱国主义记录电影,看到观影人数和排片场数均不是很理想,而这实在要人感慨。记得小时候是一直听着《中国人民志愿军战歌 》长大的, ‘“雄赳赳气昂昂过鸭绿江”是多么熟悉的调子,而现如今的年轻人又有多少人还记得那 阅读全文

posted @ 2021-09-16 10:30 Angry_Panda 阅读(128) 评论(1) 推荐(0)

openAI的比赛retro contest的一些细节设置(Detail)
摘要:2018年openAI公司搞了一个比赛retro contest,该比赛目的是为了在自家的库retro上测试迁移强化学习的性能,虽然这个比赛已经结束多年但是现在了解一些也是有一定益处的。 比赛细节介绍,原网址: https://contest.openai.com/2018-1/details/#g 阅读全文

posted @ 2021-09-16 07:01 Angry_Panda 阅读(192) 评论(0) 推荐(0)

python库 —— gym retro 的 ROMs文件下载地址
摘要:如题: python库 —— gym retro 的 ROMs文件下载地址: https://archive.org/details/No-Intro-Collection_2016-01-03_Fixed 阅读全文

posted @ 2021-09-14 15:57 Angry_Panda 阅读(352) 评论(0) 推荐(0)

【转载】 Integrating New Games into Retro Gym
摘要:https://medium.com/aureliantactics/integrating-new-games-into-retro-gym-12b237d3ed75 OpenAI’s retro gym is a great tool for using Reinforcement Learni 阅读全文

posted @ 2021-09-14 10:53 Angry_Panda 阅读(169) 评论(0) 推荐(0)

openAI的仿真环境Gym Retro的Game Integration——新游戏融合(2)( 示例 demo )
摘要:内容接前文: openAI的仿真环境Gym Retro的Game Integration——新游戏融合(将retro中没有融合的ROM游戏加入其中) 前文大致简单的介绍了gym retro 库对新游戏融合的一些基础知识,本博文以例子作为示范。 将gym retro库中的Airstriker-Gene 阅读全文

posted @ 2021-09-14 08:11 Angry_Panda 阅读(575) 评论(0) 推荐(0)

openAI的仿真环境Gym Retro的Game Integration——新游戏融合(将retro中没有融合的ROM游戏加入其中)
摘要:官方原地址: https://retro.readthedocs.io/en/latest/integration.html#integration-files 首先结束一下什么叫做游戏融合,这里面给的这个名字虽然感觉不是很恰当但是自己也没有想到什么更好的名字。 retro其实就是把多个ROMs游戏 阅读全文

posted @ 2021-09-13 11:52 Angry_Panda 阅读(2030) 评论(1) 推荐(0)

openAI的仿真环境Gym Retro的Python API接口(续1)—— 游戏过程记录及回放
摘要:如题,本文主要介绍仿真环境Gym Retro的Python API接口 。 官网地址: https://retro.readthedocs.io/en/latest/python.html 本文环境配置:如何使用Python环境下的2D经典游戏仿真器(openai推出的)retro库运行游戏"刺猬索 阅读全文

posted @ 2021-09-12 19:42 Angry_Panda 阅读(379) 评论(0) 推荐(0)

openAI的仿真环境Gym Retro的Python API接口
摘要:如题,本文主要介绍仿真环境Gym Retro的Python API接口 。 官网地址: https://retro.readthedocs.io/en/latest/python.html gym-retro 的Python接口和gym基本保持一致,或者说是兼容的,在使用gym-retro的时候会调 阅读全文

posted @ 2021-09-11 07:20 Angry_Panda 阅读(1207) 评论(0) 推荐(0)

如何使用Python环境下的2D经典游戏仿真器(openai推出的)retro库运行游戏"刺猬索尼克" (SonicTheHedgehog-Genesis)
摘要:很多资料上都有使用游戏仿真器(openai推出的)retro库运行游戏"刺猬索尼克" (SonicTheHedgehog-Genesis),但是均没有给出详细的安装该款游戏的步骤,经过自己的探索终于成功安装上。 首先,本文假设你已经安装好了Python接口的仿真器 retro ,同时你也有steam 阅读全文

posted @ 2021-09-09 21:58 Angry_Panda 阅读(497) 评论(2) 推荐(0)

运行openai的gym代码报错提示import pyglet,安装后依然报错:ImportError: sys.meta_path is None, Python is likely shutting down
摘要:运行代码: import gym def cartpole(): environment = gym.make('CartPole-v1') environment.reset() for _ in range(1000): environment.render() action = environ 阅读全文

posted @ 2021-09-08 16:43 Angry_Panda 阅读(1037) 评论(0) 推荐(0)

“阿里事件”的结束真的是结束吗
摘要:“阿里事件”的结束真的是结束吗,我想“阿里事件”的结束不应该是结束而应该是开始,很多职场的潜规则,酒局乱象应该是得到大家关注的事情了。 “阿里事件”最终是以男主无罪释放落幕,案件最终的结局很大程度上取决于涉案男主妻子的努力,最后在涉案女主是否存在主动上存在争议,而后阿里公司发布公告宣布相信争议。整个 阅读全文

posted @ 2021-09-08 07:58 Angry_Panda 阅读(226) 评论(1) 推荐(0)

HP笔记本电脑——暗夜精灵2pro继电池鼓包后出现无法充电的问题,最后电量显示:0%可用(电源已接通,未充电)
摘要:问题如题,最近使用暗夜精灵2pro笔记本(自己17年5月1节日购买)使用了四年,使用了第二年的时候出现电池鼓包问题于是自己花了不到200元在某宝上购入电池进行替换同时更新bios,正常使用到今年8月20日,然后出现了电量显示:0%可用(电源已接通,未充电)的问题,各种百度后怀疑是自己的电池又一次坏掉 阅读全文

posted @ 2021-09-04 23:47 Angry_Panda 阅读(3531) 评论(15) 推荐(0)

NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)—— 到底实现了什么功能,意义价值又是什么???
摘要:相关内容: NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装——强化学习的仿真训练环境 NVIDIA Isaac Gym 实现的功能就是在GPU端运行机器人仿真环境。 具体来看,实现了两个方面的功能: 1. GPU端运行的机器人仿真环境 2. GPU端 阅读全文

posted @ 2021-09-02 19:51 Angry_Panda 阅读(522) 评论(0) 推荐(0)

NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装——强化学习的仿真训练环境 (续2)
摘要:紧接前文: NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装——强化学习的仿真训练环境 本文主要给出 NVIDIA Isaac Gym 在给出的pytorch下PPO算法下运行例子的运行命令例子: 下面就给出几个使用rlgpu文件下的reinforce 阅读全文

posted @ 2021-09-02 13:01 Angry_Panda 阅读(712) 评论(0) 推荐(0)

大规模强化学习仿真是否有用???
摘要:这个问题思考了蛮久,现在的强化学习一直都是在仿真环境下进行的,和实际应用环境并不相符,除非是为游戏环境服务的,不然在仿真环境下进行强化学习训练、研究又有什么实际意义和用处呢,而大规模的仿真环境下的强化学习又有什么实际意义呢??? 特别说明一下,在传统的定义中(一些以前的文献表述中)大规模强化学习是指 阅读全文

posted @ 2021-09-02 08:45 Angry_Panda 阅读(420) 评论(0) 推荐(0)

NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装——强化学习的仿真训练环境
摘要:2023年3月3日更新 在新版本 中使用conda安装比较顺利即可完成,我们只需要在isaacgym/python路径下运行../create_conda_env_rlgpu.sh即可完成依赖环境和pytorh、cuda环境的conda下安装,执行完该脚本后只需要在isaacgym/python路径 阅读全文

posted @ 2021-09-01 22:49 Angry_Panda 阅读(2787) 评论(0) 推荐(1)

NVIDIA公司推出的GPU运行环境下的机器人仿真环境(NVIDIA Isaac Gym)的安装要求——强化学习的仿真训练环境
摘要:2023年3月3日更新 NVIDIA Isaac Gym 的下载地址: https://developer.nvidia.com/isaac-gym/download 个人感觉这个版本更新最大的一个改变就是把仿真环境和RL算法环境进行了分割,仿真环境依旧为: https://developer.nv 阅读全文

posted @ 2021-09-01 11:50 Angry_Panda 阅读(1246) 评论(1) 推荐(0)

【转载】 一块GPU顶数千个CPU内核,英伟达的这个强化学习利器技术细节终于公开了
摘要:原文地址: https://mp.weixin.qq.com/s/FmFqmIqmknkpBQbNb2ioDA 很多机器人强化学习任务都面临计算需求和仿真速度的瓶颈,而英伟达这个仿真环境可以将过去需要数千个 CPU 核参与训练的任务移植到单个 GPU 上完成训练。 强化学习已经成为机器学习中最有前途 阅读全文

posted @ 2021-09-01 10:57 Angry_Panda 阅读(451) 评论(0) 推荐(0)

导航