摘要: Sparse Reward 推荐资料 《深度强化学习中稀疏奖励问题研究综述》1 李宏毅深度强化学习Sparse Reward4 ​ 强化学习算法在被引入深度神经网络后,对大量样本的需求更加明显。如果智能体在与环境的交互过程中没有获得奖励,那么该样本在基于值函数和基于策略梯度的损失中的贡献会很小。 ​ 阅读全文
posted @ 2021-08-03 23:06 Dawn嗯 阅读(2321) 评论(0) 推荐(0)
摘要: VSCode远程免密登录 步骤 本地生成密钥 生成命令如下: ssh-keygen -t rsa 会生成id_rsa, id_rsa.pub两个文件 公钥拷贝到服务器 将公钥id_rsa.pub拷贝到服务器的\home\用户名\.ssh\下。 添加公钥 在服务器上,把公钥加入到authorized_ 阅读全文
posted @ 2021-07-30 14:26 Dawn嗯 阅读(120) 评论(0) 推荐(0)
摘要: Resnet网络详细结构(针对Cifar10) 结构 具体结构(Pytorch) conv1 (conv1): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False) (bn1): BatchNorm2 阅读全文
posted @ 2021-07-28 23:30 Dawn嗯 阅读(259) 评论(0) 推荐(0)
摘要: 卷积的等变性(equivariant) / 不变性(invariant) 阅读全文
posted @ 2021-06-13 21:14 Dawn嗯 阅读(1512) 评论(0) 推荐(0)
摘要: pointnet.pytorch代码解析 阅读全文
posted @ 2021-01-04 17:47 Dawn嗯 阅读(681) 评论(0) 推荐(0)
摘要: 参考:Pdb— Python的调试器 pdb 模块定义了一个交互式源代码调试器,用于 Python 程序。它支持在源码行间设置(有条件的)断点和单步执行,检视堆栈帧,列出源码列表,以及在任何堆栈帧的上下文中运行任意 Python 代码。它还支持事后调试,可以在程序控制下调用。 Pdb的调用 用pdb 阅读全文
posted @ 2020-08-12 12:07 Dawn嗯 阅读(156) 评论(0) 推荐(0)
摘要: Torchvision.Transforms Transforms包含常用图像转换操作。可以使用Compose将它们链接在一起。 此外,还有torchvision.transforms.functional模块,可以对转换进行细粒度控制。 如果需要构建更复杂的图像转换方式,这将很有用。 class 阅读全文
posted @ 2020-08-11 23:46 Dawn嗯 阅读(223) 评论(0) 推荐(0)
摘要: 文章目录 Size s=size(A) [r,c]=size(A) [r,c,m]=size(A) size(A,n) 二进制和十进制转换 dec2bin mean 均值 mean(a,1) mean(a,2) max(min) 最大(小)值 C = max(A) C = max(A,B) C = 阅读全文
posted @ 2020-07-28 17:46 Dawn嗯 阅读(1168) 评论(0) 推荐(0)
摘要: VS Code的相关配置 VS Code的插件安装位置改变 可以通过创建连接,将默认的extensions位置,改变到D盘 Windows 链接彻底解决 vscode插件安装位置问题 mklink /D "C:\Users\{username}\.vscode-insiders\extensions 阅读全文
posted @ 2020-07-21 16:24 Dawn嗯 阅读(831) 评论(0) 推荐(0)
摘要: Pytorch指定GPU的方法 改变系统变量 改变系统环境变量仅使目标显卡,编辑 .bashrc文件,添加系统变量 export CUDA_VISIBLE_DEVICES=0 #这里是要使用的GPU编号 在程序开头设置 os.environ["CUDA_VISIBLE_DEVICES"] = '0, 阅读全文
posted @ 2020-07-21 15:29 Dawn嗯 阅读(1801) 评论(0) 推荐(0)