穷酸秀才大草包

Long Short-Term Memory Spiking Networks and Their Applications

摘要：循环SNN 阅读全文

posted @ 2020-11-07 22:14 穷酸秀才大草包阅读(1156) 评论(0) 推荐(0)

Soft Actor-Critic Algorithms and Applications

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Arxiv：https://arxiv.org/abs/1812.05905 Abstract 无模型的深度RL算法已成功应用于一系列具有挑战性的序列决策和控制任务。但是，这些方法通常面临两个主要挑战：高样本复杂性和超参数的脆弱性。这两个阅读全文

posted @ 2020-11-02 19:07 穷酸秀才大草包阅读(879) 评论(0) 推荐(0)

Addressing Function Approximation Error in Actor-Critic Methods

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！论文笔记：https://zhuanlan.zhihu.com/p/55307499 Arxiv：https://arxiv.org/pdf/1802.09477.pdf ICML 2018（TD3） Abstract 在基于价值的RL方阅读全文

posted @ 2020-10-31 14:43 穷酸秀才大草包阅读(947) 评论(0) 推荐(1)

Proximal Policy Optimization Algorithms

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv: Learning, (2017) Abstract 我们提出了一系列用于RL的策略梯度方法，该方法在通过环境交互进行数据采样与使用随机梯度上升优化"替代"目标函数之间交替进行。尽管标准策略梯度方法对每个数据样本执行一个梯度更阅读全文

posted @ 2020-10-29 15:03 穷酸秀才大草包阅读(1035) 评论(0) 推荐(0)

Continuous Control with Deep Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！论文笔记：https://zhuanlan.zhihu.com/p/26754280 Arxiv：https://arxiv.org/pdf/1509.02971.pdf Published as a conference paper a 阅读全文

posted @ 2020-10-28 13:52 穷酸秀才大草包阅读(1344) 评论(0) 推荐(0)

Asynchronous Methods for Deep Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICML 2016 Abstract 我们提出了一个概念上简单且轻量级的深度强化学习框架，该框架使用异步梯度下降来优化深度神经网络控制器。我们提出了四种标准强化学习算法的异步变体，并表明并行参与者学习器对训练具有稳定作用，允许所有四种方法阅读全文

posted @ 2020-10-18 21:06 穷酸秀才大草包阅读(714) 评论(0) 推荐(0)

基于策略梯度的强化学习论文调研

摘要： RL-Adventure: Policy Gradients 开源代码：https://github.com/higgsfield/RL-Adventure-2 自身实现：https://github.com/lucifer2859/Policy-Gradients 1、Advantage Acto 阅读全文

posted @ 2020-10-18 20:09 穷酸秀才大草包阅读(288) 评论(0) 推荐(0)

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！论文笔记：https://zhuanlan.zhihu.com/p/85003758，https://zhuanlan.zhihu.com/p/131625682 ICML 2018 Abstract 无模型的深度RL算法已在一系列具有挑阅读全文

posted @ 2020-10-18 20:02 穷酸秀才大草包阅读(2287) 评论(0) 推荐(0)

固定随机种子比较强化学习算法

摘要： random.seed(args.seed) np.random.seed(args.seed) torch.cuda.manual_seed(args.seed) torch.manual_seed(args.seed) torch.backends.cudnn.deterministic = T 阅读全文

posted @ 2020-10-12 09:54 穷酸秀才大草包阅读(1037) 评论(0) 推荐(0)

Action and learning shape the activity of neuronal circuits in the visual cortex

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Current Opinion in Neurobiology, (2018) Abstract 非感觉变量强烈影响成年小鼠初级视觉皮层的神经元活动。对视觉刺激的神经元反应受行为状态（如激发和运动活动）调节，并受经验影响。这种动态过程导致阅读全文

posted @ 2020-09-29 10:57 穷酸秀才大草包阅读(357) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告