Alan_Fire - 博客园

2018年9月29日

摘要：背景知识最近再看一些量化交易相关的材料，偶然在网上看到了一个关于用RNN实现股票预测的文章，出于好奇心把文章中介绍的代码在本地跑了一遍，发现可以work。于是就花了两个晚上的时间学习了下代码，顺便把核心的内容翻译成中文分享给大家。首先讲讲对于股票预测的理解，股票是一种可以轻易用数字表现律动的交易阅读全文

posted @ 2018-09-29 23:54 Alan_Fire 阅读(5096) 评论(1) 推荐(1)

深度强化学习方向论文整理

摘要：一. 开山鼻祖DQN 1. Playing Atari with Deep Reinforcement Learning，V. Mnih et al., NIPS Workshop, 2013. 2. Human-level control through deep reinforcement le 阅读全文

posted @ 2018-09-29 23:47 Alan_Fire 阅读(3881) 评论(0) 推荐(3)

深度强化学习——连续动作控制DDPG、NAF

摘要：一、存在的问题 DQN是一个面向离散控制的算法，即输出的动作是离散的。对应到Atari 游戏中，只需要几个离散的键盘或手柄按键进行控制。然而在实际中，控制问题则是连续的，高维的，比如一个具有6个关节的机械臂，每个关节的角度输出是连续值，假设范围是0°~360°，归一化后为（-1，1）。若把每个关节阅读全文

posted @ 2018-09-29 23:45 Alan_Fire 阅读(4227) 评论(0) 推荐(0)

深度学习在文本、语音和视觉等方向的进展--强化学习

摘要： AlphaZero自学成才，机器人Atlas苦练后空翻……2017年，人工智能所取得的新进展真是让人应接不暇。而所有的这些进展，都离不开深度学习一年来在底层研究和技术开发上的新突破。圣诞节前后，Statsbot的数据科学家Ed Tyantov专门评估了深度学习这一年在文本、语音和视觉等方向的各项研究阅读全文

posted @ 2018-09-29 23:42 Alan_Fire 阅读(663) 评论(0) 推荐(0)

论文：深度强化学习基于像素的乒乓游戏

摘要：英文原文：Deep Reinforcement Learning: Pong from Pixels 作者：Andrej Karpathy (Stanford University) 译者：郭江这是一篇早就应该写的关于强化学习的文章。强化学习现在很火!你可能已经注意到计算机现在可以自动(从游戏画面阅读全文

posted @ 2018-09-29 23:38 Alan_Fire 阅读(719) 评论(0) 推荐(0)

【RL前沿】深度强化学习的最新进展 by 2017.12.12

摘要：作者：Volodymyr Mnih Google DeepMind科学家。在Geoffrey Hinton的指导下完成了多伦多大学的机器学习博士学位。在此之前，在Csab Szepesvari的指导下完成了阿尔伯塔大学计算科学硕士学位。视频地址如下： https://www.youtube.c 阅读全文

posted @ 2018-09-29 23:34 Alan_Fire 阅读(326) 评论(0) 推荐(0)

详解 Facebook 田渊栋 NIPS2017 论文：深度强化学习研究的 ELF 平台

摘要：这周，机器学习顶级会议 NIPS 2017 的论文评审结果已经通知到各位论文作者了，许多作者都马上发 Facebook/Twitter/Blog/ 朋友圈分享了论文被收录的喜讯。大家的熟人 Facebook 人工智能研究院研究员田渊栋也有一篇论文入选，论文名为「ELF: An Extensive, 阅读全文

posted @ 2018-09-29 23:32 Alan_Fire 阅读(553) 评论(0) 推荐(0)

强化学习入门：一文入门强化学习

摘要：转自：（原贴）http://geek.csdn.net/news/detail/201928?utm_source=tuicool&utm_medium=referral 建议参考程序视频资料：（莫烦PYTHON）https://morvanzhou.github.io/tutorials/mach 阅读全文

posted @ 2018-09-29 23:17 Alan_Fire 阅读(3235) 评论(1) 推荐(0)

深度强化学习：入门(Deep Reinforcement Learning: Scratching the surface)

摘要： RL的方案两个主要对象：Agent和Environment Agent观察Environment，做出Action，这个Action会对Environment造成一定影响和改变，继而Agent会从新的环境中获得Reward。循环上述步骤。举例：机器人把水杯打翻了，人类说“不能这么做”，机器人获阅读全文

posted @ 2018-09-29 23:10 Alan_Fire 阅读(513) 评论(0) 推荐(0)

Deep Reinforcement Learning 基础知识

摘要： Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算法。简单的说，就是和人类一样，输入感知信息比如视觉，然后通过深度神经网络，直接输出动作，中间没有ha 阅读全文

posted @ 2018-09-29 23:06 Alan_Fire 阅读(445) 评论(0) 推荐(0)

是否要入坑“深度强化学习”，看了这篇论文再说！

摘要：今天在学校又双叒叕提到了 Deep Reinforcement Learning That Matters 这篇打响 DRL（Deep Reinforcement Learning, 深度强化学习）劝退第一枪的文章后，回来以后久违刷了一下推特，看到了这篇爆文 Deep Reinforcement L 阅读全文

posted @ 2018-09-29 22:50 Alan_Fire 阅读(4438) 评论(0) 推荐(1)

复现深度强化学习论文经验之谈

摘要：近期深度强化学习领域日新月异，其中最酷的一件事情莫过于 OpenAI 和 DeepMind 训练智能体接收人类的反馈而不是传统的奖励信号。本文作者认为复现论文是提升机器学习技能的最好方式之一，所以选择了 OpenAI 论文《Deep Reinforcement Learning from Human 阅读全文

posted @ 2018-09-29 22:43 Alan_Fire 阅读(1012) 评论(0) 推荐(0)

2018年9月20日

小朋友学Java（2）：Win 7安装JDK

摘要： 1 打开命令行窗口，输入java -version。若提示不认识java命令，说明没有java环境。 1.png 1.png 2 从甲骨文网站（http://www.oracle.com/technetwork/java/javase/downloads/index.html）下载jdk。如果是阅读全文

posted @ 2018-09-20 23:21 Alan_Fire 阅读(155) 评论(0) 推荐(0)

小朋友学Java（1）：Mac系统安装JDK

摘要： 1 打开终端方法可以参考http://blog.csdn.net/haishu_zheng/article/details/73410594 2 在终端输入 java -version，提示没有Java环境，需要安装点击“更多信息”（其实就是相当于在Safari浏览器中输入http://www. 阅读全文

posted @ 2018-09-20 23:20 Alan_Fire 阅读(241) 评论(0) 推荐(0)

信息学奥赛（NOIP）复赛学习方法推荐

摘要：一、确定你的语言 NOIP包括三种语言c/c++/pascal，在最初必须确定自己使用的语言。没有c/c++基础的，个人建议使用pascal，因为它更容易上手，如果有充裕的时间，则建议c/c++，因为它们对你今后的程序编写，更有益处。二、从排序入手排序是基础中的基础，快速排序是必备本领，方法就是阅读全文

posted @ 2018-09-20 23:07 Alan_Fire 阅读(1585) 评论(0) 推荐(0)