04 2021 档案

rllab —— 强化学习 算法模块库 (环境配置失败!!!) (已经不进行维护更新,已被淘汰,由于一些老旧代码还有可能关联因此fork了下,复制了份原始项目)
摘要:代码地址: https://gitee.com/devilmaycry812839668/rllab 由于官方代码地址在github上,外网偶尔会出现网络连接中断的问题因此在国内代码库中fork了一个。 代码官方地址: https://github.com/rll/rllab 官方的使用说明: ht 阅读全文

posted @ 2021-04-27 19:52 Angry_Panda 阅读(205) 评论(0) 推荐(0)

【深度学习的linux显卡服务器维护记录】 服务器cuda不能用,nvidia-smi报错“Failed to initialize NVML: Driver/library version mismatch”
摘要:如题,服务器报错: 查看日志: 发现问题: Starting Daily apt upgrade and clean activities... 这个 apt upgrade 不是普通的update, upgrade 会直接引起系统的不稳定, 相关进程或者服务重启。 解决: sudo apt-get 阅读全文

posted @ 2021-04-24 16:53 Angry_Panda 阅读(514) 评论(1) 推荐(0)

【转载】 浅谈PyTorch的可重复性问题(如何使实验结果可复现)
摘要:原文地址: https://www.zhangshengrong.com/p/9MNlDK09NJ/ 由于在模型训练的过程中存在大量的随机操作,使得对于同一份代码,重复运行后得到的结果不一致。因此,为了得到可重复的实验结果,我们需要对随机数生成器设置一个固定的种子。 许多博客都有介绍如何解决这个问题 阅读全文

posted @ 2021-04-23 14:30 Angry_Panda 阅读(1238) 评论(1) 推荐(0)

【官网链接】 REPRODUCIBILITY —— pytorch的可复现性
摘要:官网链接地址: https://pytorch.org/docs/stable/notes/randomness.html 阅读全文

posted @ 2021-04-23 12:37 Angry_Panda 阅读(52) 评论(0) 推荐(0)

【转载】 pytorch reproducibility —— pytorch代码的可复现性
摘要:原文地址: https://www.jianshu.com/p/96767683beb6 作者:kelseyh来源:简书 在训练seq2seq的过程中,固定了所有seed, random.seed(args.seed) os.environ['PYTHONHASHSEED'] =str(args.s 阅读全文

posted @ 2021-04-23 12:14 Angry_Panda 阅读(126) 评论(0) 推荐(0)

【转载】 固定随机种子比较强化学习算法——pytorch框架
摘要:原文地址: https://www.cnblogs.com/lucifer1997/p/13801102.html random.seed(seed) np.random.seed(seed) torch.manual_seed(seed) torch.cuda.manual_seed(seed) 阅读全文

posted @ 2021-04-23 11:23 Angry_Panda 阅读(264) 评论(0) 推荐(0)

【转载】 日内瓦大学 & NeurIPS 2020 | 在强化学习中动态分配有限的内存资源
摘要:原文地址: https://hub.baai.ac.cn/view/4029 【论文标题】Dynamic allocation of limited memory resources in reinforcement learning 【作者团队】Nisheet Patel, Luigi Acerb 阅读全文

posted @ 2021-04-22 19:33 Angry_Panda 阅读(301) 评论(2) 推荐(0)

【转载】从某大学博士生上吊、喝药自杀等事件来看读博这件事
摘要:作为某大学在读的博士生每每听到说有哪个在读博士自杀了除了愤慨、可惜之情外更多的是共情和自怜,更可以说的是一种感同身受。想想自己2016年选择来现在的某高校读博到2017年正式入学这段期间可能是对于我现在人生最关键的一段时间了,那个时候我是在各大985高校里连续相关研究方向的博导,一心想着能再继续深造 阅读全文

posted @ 2021-04-21 20:12 Angry_Panda 阅读(212) 评论(0) 推荐(0)

ubuntu 服务器显示 计算显卡的剩余 显存空间 并执行计划任务
摘要:在Ubuntu服务器上需要运行gpu计算任务,由于需要无人值守的在显存空间满足条件的时候运行程序,于是有了自动显示显存的程序及自动运行任务的程序: 自动显示显存: import os import re import time memory_need = 10800 # 需求显存大小 sec = 1 阅读全文

posted @ 2021-04-19 17:29 Angry_Panda 阅读(250) 评论(0) 推荐(0)

(续) gym atari游戏的环境设置问题:Breakout-v0, Breakout-v4, BreakoutNoFrameskip-v4和BreakoutDeterministic-v4的区别
摘要:根据前文(https://www.cnblogs.com/devilmaycry812839668/p/14665072.html)我们知道: 首先是v0和v4的区别:带有v0的env表示会有25%的概率执行上一个action,而v4表示只执行agent给出的action,不会重复之前的action 阅读全文

posted @ 2021-04-16 08:44 Angry_Panda 阅读(2713) 评论(0) 推荐(0)

gym中所有可以用的模拟环境
摘要:python 代码: from gym import envs for env in envs.registry.all(): print(env.id) 打印出可用环境: Copy-v0 RepeatCopy-v0 ReversedAddition-v0 ReversedAddition3-v0 阅读全文

posted @ 2021-04-15 23:45 Angry_Panda 阅读(2221) 评论(0) 推荐(0)

【转载】 gym atari游戏的环境设置问题:Breakout-v0, Breakout-v4, BreakoutNoFrameskip-v4和BreakoutDeterministic-v4的区别
摘要:版权声明:本文为CSDN博主「ok_kakaka」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/clksjx/article/details/104053216 如题: 首先是v0和v4的区别:带有v0的env 阅读全文

posted @ 2021-04-15 23:32 Angry_Panda 阅读(878) 评论(0) 推荐(0)

(待续)【转载】 Deep Reinforcement Learning Doesn't Work Yet(这里有一篇深度强化学习劝退文)
摘要:原文: https://www.alexirpan.com/2018/02/14/rl-hard.html 阅读全文

posted @ 2021-04-04 18:01 Angry_Panda 阅读(208) 评论(0) 推荐(0)

【转载】 深度强化学习走入「死胡同」,继续死磕电子游戏还是另辟蹊径?
摘要:原文地址: https://zhuanlan.zhihu.com/p/102318263 2019 年,深度强化学习可以算得上 AI 研究的 Top 关键词之一。 无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家,还是 OpenAI 最终因太过强大而被认为可能有风险所以不公 阅读全文

posted @ 2021-04-04 11:38 Angry_Panda 阅读(252) 评论(1) 推荐(0)

【转载】 Docker-关于docker cpu的限制后,实际效果的研究
摘要:原文地址: https://zhuanlan.zhihu.com/p/46275332 思考:我们使用docker时,肯定会配置cpu和内存的限定,那么问题来了,限定后的docker使用宿主机的多核cpu时是什么策略呢(cpu分工是随机分到某个几个核上,还是固定某个核)?如果我docker内的构造资 阅读全文

posted @ 2021-04-03 22:27 Angry_Panda 阅读(811) 评论(0) 推荐(0)

个人常用的 matplotlib 绘图模板
摘要:import numpy as np import matplotlib import matplotlib.pyplot as plt matplotlib.rcParams['mathtext.fontset']='stix' plt.xlim(0, 5.5) plt.ylim(-5, 100) 阅读全文

posted @ 2021-04-02 22:40 Angry_Panda 阅读(273) 评论(0) 推荐(0)

【转载】共轭梯度法(视频讲解) 数值分析6(3共轭梯度法) ——苏州大学
摘要:视频地址: https://www.bilibili.com/video/BV16a4y1t76z/?spm_id_from=333.788.recommend_more_video.-1 阅读全文

posted @ 2021-04-01 19:35 Angry_Panda 阅读(273) 评论(0) 推荐(0)

导航