摘要:
背景知识 最近再看一些量化交易相关的材料,偶然在网上看到了一个关于用RNN实现股票预测的文章,出于好奇心把文章中介绍的代码在本地跑了一遍,发现可以work。于是就花了两个晚上的时间学习了下代码,顺便把核心的内容翻译成中文分享给大家。 首先讲讲对于股票预测的理解,股票是一种可以轻易用数字表现律动的交易 阅读全文
posted @ 2018-09-29 23:54
Alan_Fire
阅读(5055)
评论(1)
推荐(1)
摘要:
一. 开山鼻祖DQN 1. Playing Atari with Deep Reinforcement Learning,V. Mnih et al., NIPS Workshop, 2013. 2. Human-level control through deep reinforcement le 阅读全文
posted @ 2018-09-29 23:47
Alan_Fire
阅读(3866)
评论(0)
推荐(3)
摘要:
一、存在的问题 DQN是一个面向离散控制的算法,即输出的动作是离散的。对应到Atari 游戏中,只需要几个离散的键盘或手柄按键进行控制。 然而在实际中,控制问题则是连续的,高维的,比如一个具有6个关节的机械臂,每个关节的角度输出是连续值,假设范围是0°~360°,归一化后为(-1,1)。若把每个关节 阅读全文
posted @ 2018-09-29 23:45
Alan_Fire
阅读(4199)
评论(0)
推荐(0)
摘要:
AlphaZero自学成才,机器人Atlas苦练后空翻……2017年,人工智能所取得的新进展真是让人应接不暇。而所有的这些进展,都离不开深度学习一年来在底层研究和技术开发上的新突破。圣诞节前后,Statsbot的数据科学家Ed Tyantov专门评估了深度学习这一年在文本、语音和视觉等方向的各项研究 阅读全文
posted @ 2018-09-29 23:42
Alan_Fire
阅读(649)
评论(0)
推荐(0)
摘要:
英文原文:Deep Reinforcement Learning: Pong from Pixels 作者:Andrej Karpathy (Stanford University) 译者:郭江 这是一篇早就应该写的关于强化学习的文章。强化学习现在很火!你可能已经注意到计算机现在可以自动(从游戏画面 阅读全文
posted @ 2018-09-29 23:38
Alan_Fire
阅读(711)
评论(0)
推荐(0)
摘要:
作者:Volodymyr Mnih Google DeepMind科学家。 在Geoffrey Hinton的指导下完成了多伦多大学的机器学习博士学位。 在此之前,在Csab Szepesvari的指导下完成了阿尔伯塔大学计算科学硕士学位。 视频地址如下: https://www.youtube.c 阅读全文
posted @ 2018-09-29 23:34
Alan_Fire
阅读(319)
评论(0)
推荐(0)
摘要:
这周,机器学习顶级会议 NIPS 2017 的论文评审结果已经通知到各位论文作者了,许多作者都马上发 Facebook/Twitter/Blog/ 朋友圈分享了论文被收录的喜讯。大家的熟人 Facebook 人工智能研究院研究员田渊栋也有一篇论文入选,论文名为「ELF: An Extensive, 阅读全文
posted @ 2018-09-29 23:32
Alan_Fire
阅读(544)
评论(0)
推荐(0)
摘要:
转自:(原贴)http://geek.csdn.net/news/detail/201928?utm_source=tuicool&utm_medium=referral 建议参考程序视频资料:(莫烦PYTHON)https://morvanzhou.github.io/tutorials/mach 阅读全文
posted @ 2018-09-29 23:17
Alan_Fire
阅读(3198)
评论(1)
推荐(0)
摘要:
RL的方案 两个主要对象:Agent和Environment Agent观察Environment,做出Action,这个Action会对Environment造成一定影响和改变,继而Agent会从新的环境中获得Reward。循环上述步骤。 举例: 机器人把水杯打翻了,人类说“不能这么做”,机器人获 阅读全文
posted @ 2018-09-29 23:10
Alan_Fire
阅读(499)
评论(0)
推荐(0)
摘要:
Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算法。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有ha 阅读全文
posted @ 2018-09-29 23:06
Alan_Fire
阅读(429)
评论(0)
推荐(0)
摘要:
今天在学校又双叒叕提到了 Deep Reinforcement Learning That Matters 这篇打响 DRL(Deep Reinforcement Learning, 深度强化学习)劝退第一枪的文章后,回来以后久违刷了一下推特,看到了这篇爆文 Deep Reinforcement L 阅读全文
posted @ 2018-09-29 22:50
Alan_Fire
阅读(4424)
评论(0)
推荐(1)
摘要:
近期深度强化学习领域日新月异,其中最酷的一件事情莫过于 OpenAI 和 DeepMind 训练智能体接收人类的反馈而不是传统的奖励信号。本文作者认为复现论文是提升机器学习技能的最好方式之一,所以选择了 OpenAI 论文《Deep Reinforcement Learning from Human 阅读全文
posted @ 2018-09-29 22:43
Alan_Fire
阅读(996)
评论(0)
推荐(0)
浙公网安备 33010602011771号