Angry_Panda - 博客园

强化学习中REIINFORCE算法和AC算法在算法理论和实际代码设计中的区别

摘要：背景就不介绍了，REINFORCE算法和AC算法是强化学习中基于策略这类的基础算法，这两个算法的算法描述（伪代码）参见Sutton的reinforcement introduction(2nd)。 AC算法可以看做是在REINFORCE算法基础上扩展的，所以这里我们主要讨论REINFORCE算法中算阅读全文

posted @ 2022-02-13 14:26 Angry_Panda 阅读(503) 评论(1) 推荐(0)

【观察网视频】不是中国也不是社会主义，美国害怕的是别的东西

摘要：视频地址： https://www.youtube.com/watch?v=MvLxuJYKXaA 拒绝新殖民主义，我们要站起来就需要在科技上站起来、在经济上站起来，这才是真正的站起来。阅读全文

posted @ 2022-02-03 22:40 Angry_Panda 阅读(41) 评论(1) 推荐(0)

再谈《强化学习算法之DQN算法中的经验池的实现》 experience_replay_buffer模块的实现

摘要：去年曾写过一篇DQN经验池模块编写的博文：强化学习算法之DQN算法中的经验池的实现，experience_replay_buffer部分的实现最近又看到了一个经验池实现的代码，把这两个实现做了一下对比： memory.py 新的经验池实现代码： import numpy as np Transi 阅读全文

posted @ 2022-02-01 16:35 Angry_Panda 阅读(337) 评论(0) 推荐(0)

DQN2013代码尝试复现版（存在各种实现问题及Bug，个人尝试复现版，没有follow价值）

摘要：在网上找的各种dqn代码修改而成，只实现了基本功能，对各个游戏的适配性没有进行，代码中还存在各种bug，属于草稿品质，不适合fellow，只是一时学习之用而进行尝试的残次半成品。核心代码已实现，为DQN2013版本，后端用的是pytorch框架。代码分享在： https://gitee.com/d 阅读全文

posted @ 2022-02-01 12:49 Angry_Panda 阅读(148) 评论(0) 推荐(0)

pytorch中神经网络的多线程数设置：torch.set_num_threads(N)

摘要：实验室的同学一直都是在服务器上既用CPU训练神经网络也有使用GPU的，最近才发现原来在pytorch中可以通过设置 torch.set_num_threads(args.thread) 来限制CPU上进行深度学习训练的线程数。 torch.set_num_threads(args.thread) 在阅读全文

posted @ 2022-01-29 09:12 Angry_Panda 阅读(11881) 评论(0) 推荐(0)

读《PyTorch + NumPy这么做会降低模型准确率，这是bug还是预期功能？》

摘要：看了文章：【转载】浅谈PyTorch的可重复性问题(如何使实验结果可复现) 然后，转到： PyTorch + NumPy这么做会降低模型准确率，这是bug还是预期功能？发现了在pytorch中的一个容易被忽略的问题，那就是多进程操作时各个进程其实是和父进程有着相同的随机种子的，重点不在于各个子阅读全文

posted @ 2022-01-24 19:09 Angry_Panda 阅读(234) 评论(0) 推荐(0)

经典视频分享：Machine Learning: A New ICE (Identification, Control, Estimation) Age ? —— 自动控制和人工智能的结合前景

摘要：机器学习作为近几年兴起的学科，虽然他诞生的时间已经而久远了，但是真正走进人们视野也就是这几年的事情。机器学习领域本身只有强化学习这个分支和控制类是天然关联的，因此近几年国内的知名高校的强化学习研究者很多都在试图探索强化学习和自动控制的融合应用的可能性，国内对这个融合方向还在设想的时候国外学者就已经阅读全文

posted @ 2022-01-24 11:44 Angry_Panda 阅读(157) 评论(0) 推荐(0)

【转载】How to Use t-SNE Effectively —— （机器学习数据可视化） t-SNE使用指南

摘要：原文地址：https://distill.pub/2016/misread-tsne/ 说明：原文是比较有名的一个指南性博文，讲的就是t-SNE技术的一些使用注意事项和说明，属于说明性文章，内容很不错。原文是可以进行可视化交互操作这个t-SNE算法示例的，喜欢进行手动交互操作改算法例子的可以跳转阅读全文

posted @ 2022-01-22 15:29 Angry_Panda 阅读(256) 评论(0) 推荐(0)

【转载】流形学习 (Manifold Learning) ——（学习笔记）

摘要：第一篇：摘抄自：https://zhuanlan.zhihu.com/p/54516805 从度量空间到拓扑空间拓扑这门学科的一个方向涉及到去研究集合在“连续变形”下一些不变的性质。所谓的“连续变形”，直观理解就是像捏橡皮泥一样让集合的形状有一种连续的变化（后面会提到其实它就是指同胚（homeo 阅读全文

posted @ 2022-01-22 15:29 Angry_Panda 阅读(2030) 评论(0) 推荐(0)

【转载】机器学习数据可视化（t-SNE 使用指南）—— Why You Are Using t-SNE Wrong

摘要：原文地址： https://towardsdatascience.com/why-you-are-using-t-sne-wrong-502412aab0c0 Source: https://datascienceplus.com/multi-dimensional-reduction-and-vi 阅读全文

posted @ 2022-01-22 15:29 Angry_Panda 阅读(215) 评论(0) 推荐(0)

Angry Panda（T-800）

公告

导航