摘要: 背景知识 最近再看一些量化交易相关的材料,偶然在网上看到了一个关于用RNN实现股票预测的文章,出于好奇心把文章中介绍的代码在本地跑了一遍,发现可以work。于是就花了两个晚上的时间学习了下代码,顺便把核心的内容翻译成中文分享给大家。 首先讲讲对于股票预测的理解,股票是一种可以轻易用数字表现律动的交易 阅读全文
posted @ 2018-09-29 23:54 Alan_Fire 阅读(5055) 评论(1) 推荐(1)
摘要: 一. 开山鼻祖DQN 1. Playing Atari with Deep Reinforcement Learning,V. Mnih et al., NIPS Workshop, 2013. 2. Human-level control through deep reinforcement le 阅读全文
posted @ 2018-09-29 23:47 Alan_Fire 阅读(3866) 评论(0) 推荐(3)
摘要: 一、存在的问题 DQN是一个面向离散控制的算法,即输出的动作是离散的。对应到Atari 游戏中,只需要几个离散的键盘或手柄按键进行控制。 然而在实际中,控制问题则是连续的,高维的,比如一个具有6个关节的机械臂,每个关节的角度输出是连续值,假设范围是0°~360°,归一化后为(-1,1)。若把每个关节 阅读全文
posted @ 2018-09-29 23:45 Alan_Fire 阅读(4199) 评论(0) 推荐(0)
摘要: AlphaZero自学成才,机器人Atlas苦练后空翻……2017年,人工智能所取得的新进展真是让人应接不暇。而所有的这些进展,都离不开深度学习一年来在底层研究和技术开发上的新突破。圣诞节前后,Statsbot的数据科学家Ed Tyantov专门评估了深度学习这一年在文本、语音和视觉等方向的各项研究 阅读全文
posted @ 2018-09-29 23:42 Alan_Fire 阅读(649) 评论(0) 推荐(0)
摘要: 英文原文:Deep Reinforcement Learning: Pong from Pixels 作者:Andrej Karpathy (Stanford University) 译者:郭江 这是一篇早就应该写的关于强化学习的文章。强化学习现在很火!你可能已经注意到计算机现在可以自动(从游戏画面 阅读全文
posted @ 2018-09-29 23:38 Alan_Fire 阅读(711) 评论(0) 推荐(0)
摘要: 作者:Volodymyr Mnih Google DeepMind科学家。 在Geoffrey Hinton的指导下完成了多伦多大学的机器学习博士学位。 在此之前,在Csab Szepesvari的指导下完成了阿尔伯塔大学计算科学硕士学位。 视频地址如下: https://www.youtube.c 阅读全文
posted @ 2018-09-29 23:34 Alan_Fire 阅读(319) 评论(0) 推荐(0)
摘要: 这周,机器学习顶级会议 NIPS 2017 的论文评审结果已经通知到各位论文作者了,许多作者都马上发 Facebook/Twitter/Blog/ 朋友圈分享了论文被收录的喜讯。大家的熟人 Facebook 人工智能研究院研究员田渊栋也有一篇论文入选,论文名为「ELF: An Extensive, 阅读全文
posted @ 2018-09-29 23:32 Alan_Fire 阅读(544) 评论(0) 推荐(0)
摘要: 转自:(原贴)http://geek.csdn.net/news/detail/201928?utm_source=tuicool&utm_medium=referral 建议参考程序视频资料:(莫烦PYTHON)https://morvanzhou.github.io/tutorials/mach 阅读全文
posted @ 2018-09-29 23:17 Alan_Fire 阅读(3198) 评论(1) 推荐(0)
摘要: RL的方案 两个主要对象:Agent和Environment Agent观察Environment,做出Action,这个Action会对Environment造成一定影响和改变,继而Agent会从新的环境中获得Reward。循环上述步骤。 举例: 机器人把水杯打翻了,人类说“不能这么做”,机器人获 阅读全文
posted @ 2018-09-29 23:10 Alan_Fire 阅读(499) 评论(0) 推荐(0)
摘要: Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算法。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有ha 阅读全文
posted @ 2018-09-29 23:06 Alan_Fire 阅读(429) 评论(0) 推荐(0)
摘要: 今天在学校又双叒叕提到了 Deep Reinforcement Learning That Matters 这篇打响 DRL(Deep Reinforcement Learning, 深度强化学习)劝退第一枪的文章后,回来以后久违刷了一下推特,看到了这篇爆文 Deep Reinforcement L 阅读全文
posted @ 2018-09-29 22:50 Alan_Fire 阅读(4424) 评论(0) 推荐(1)
摘要: 近期深度强化学习领域日新月异,其中最酷的一件事情莫过于 OpenAI 和 DeepMind 训练智能体接收人类的反馈而不是传统的奖励信号。本文作者认为复现论文是提升机器学习技能的最好方式之一,所以选择了 OpenAI 论文《Deep Reinforcement Learning from Human 阅读全文
posted @ 2018-09-29 22:43 Alan_Fire 阅读(996) 评论(0) 推荐(0)
摘要: 1 打开命令行窗口,输入java -version。 若提示不认识java命令,说明没有java环境。 1.png 1.png 2 从甲骨文网站(http://www.oracle.com/technetwork/java/javase/downloads/index.html)下载jdk。 如果是 阅读全文
posted @ 2018-09-20 23:21 Alan_Fire 阅读(154) 评论(0) 推荐(0)
摘要: 1 打开终端 方法可以参考http://blog.csdn.net/haishu_zheng/article/details/73410594 2 在终端输入 java -version,提示没有Java环境,需要安装 点击“更多信息”(其实就是相当于在Safari浏览器中输入http://www. 阅读全文
posted @ 2018-09-20 23:20 Alan_Fire 阅读(238) 评论(0) 推荐(0)
摘要: 一、确定你的语言 NOIP包括三种语言c/c++/pascal,在最初必须确定自己使用的语言。没有c/c++基础的,个人建议使用pascal,因为它更容易上手,如果有充裕的时间,则建议c/c++,因为它们对你今后的程序编写,更有益处。 二、从排序入手 排序是基础中的基础,快速排序是必备本领,方法就是 阅读全文
posted @ 2018-09-20 23:07 Alan_Fire 阅读(1570) 评论(0) 推荐(0)