会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
洗个痛快澡
博客园
首页
新随笔
联系
订阅
管理
2019年8月20日
深度强化学习-梯度下降Policy Gradient
摘要: 基于价值Value的强化学习算法,例如Q-Learning,其基本思想为根据当前的状态,计算采取每个动作的价值,然后根据贪心策略去选择相应的动作。这种方法由于受限于动作和状态的数量,即Q表的大小,并不适用于机器人系统。这是因为机器人系统的执行器是输出连续动作的。 1. 什么是Policy Gradi
阅读全文
posted @ 2019-08-20 16:06 洗个痛快澡吧
阅读(441)
评论(0)
推荐(0)
2017年5月3日
Fast-Classifying, High-Accuracy Spiking Deep Networks Through Weight and Threshold Balancing
摘要: 本文介绍如何将传统的的前馈网络训练所得的链接权至转化到脉冲神经网络。 Spiking Network Conversion 脉冲神经网络转换 一旦网络中的ReLU替换为IF Neuron,分类精度会有一定损失,损失产生原因如下: Experiment Setup 首先,讲MNIST归一化处理weig
阅读全文
posted @ 2017-05-03 16:22 洗个痛快澡吧
阅读(347)
评论(0)
推荐(0)
公告