Alan_Fire - 博客园

2018年11月19日

摘要：矩阵求导的技术，在统计学、控制论、机器学习等领域有广泛的应用。鉴于我看过的一些资料或言之不详、或繁乱无绪，本文来做个科普，分作两篇，上篇讲标量对矩阵的求导术，下篇讲矩阵对矩阵的求导术。本文使用小写字母x表示标量，粗体小写字母表示（列）向量，大写字母X表示矩阵。首先来琢磨一下定义，标量f对矩阵X的导阅读全文

posted @ 2018-11-19 09:41 Alan_Fire 阅读(1190) 评论(0) 推荐(0)

2018年11月18日

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

摘要： Github https://github.com/sebastianruder/NLP-progress 官方网址 https://nlpprogress.com/ Github https://github.com/sebastianruder/NLP-progress https://gith 阅读全文

posted @ 2018-11-18 22:29 Alan_Fire 阅读(784) 评论(0) 推荐(0)

2018年11月17日

深度学习、图像识别入门，从VGG16卷积神经网络开始

摘要：刚开始接触深度学习、卷积神经网络的时候非常懵逼，不知道从何入手，我觉得应该有一个进阶的过程，也就是说，理应有一些基本概念作为奠基石，让你有底气去完全理解一个庞大的卷积神经网络：本文思路：一、我认为学习卷积神经网络必须知道的几个概念： 1、卷积过程：我们经常说卷积神经网络卷积神经网络，到底什么才阅读全文

posted @ 2018-11-17 00:14 Alan_Fire 阅读(687) 评论(0) 推荐(0)

2018年11月16日

反向传播神经网络极简入门

摘要：我一直在找一份简明的神经网络入门，然而在中文圈里并没有找到。直到我看到了这份162行的Python实现，以及对应的油管视频之后，我才觉得这就是我需要的极简入门资料。这份极简入门笔记不需要突触的图片做装饰，也不需要赘述神经网络的发展历史；要推导有推导，要代码有代码，关键是，它们还对得上。对于欠缺的背景阅读全文

posted @ 2018-11-16 22:55 Alan_Fire 阅读(1096) 评论(0) 推荐(0)

R语言中的遗传算法详细解析

摘要：前言人类总是在生活中摸索规律，把规律总结为经验，再把经验传给后人，让后人发现更多的规规律，每一次知识的传递都是一次进化的过程，最终会形成了人类的智慧。自然界规律，让人类适者生存地活了下来，聪明的科学家又把生物进化的规律，总结成遗传算法，扩展到了更广的领域中。本文将带你走进遗传算法的世界。目录阅读全文

posted @ 2018-11-16 22:39 Alan_Fire 阅读(4215) 评论(1) 推荐(2)

模拟退火算法

摘要：一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前，先介绍爬山算法。爬山算法是一种简单的贪心搜索算法，该算法每次从当前解的临近解空间中选择一个最优解作为当前解，直到达到一个局部最优解。爬山算法实现很简单，其主要缺点是会陷入局部最优解，而不一定能搜索到全局最优解。如图1所示：假设C点阅读全文

posted @ 2018-11-16 22:30 Alan_Fire 阅读(584) 评论(0) 推荐(0)

TensorFlow利用A3C算法训练智能体玩CartPole游戏

摘要：本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型。研究人员使用 tf.keras、OpenAI 训练了一个使用「异步优势动作评价」（Asynchronous Advantage Actor Critic，A3C）算法的智能体，通过 A3C 的实现解决了 CartPol 阅读全文

posted @ 2018-11-16 18:27 Alan_Fire 阅读(2688) 评论(0) 推荐(0)

伯克利推出「看视频学动作」的AI智能体

摘要：伯克利曾经提出 DeepMimic 框架，让智能体模仿参考动作片段来学习高难度技能。但这些参考片段都是经过动作捕捉合成的高度结构化数据，数据本身的获取需要很高的成本。而近日，他们又更进一步，提出了可以直接模仿 Youtube 视频人物高难度动作的新框架 SFV。从 YouTube 视频中学习技能的阅读全文

posted @ 2018-11-16 13:03 Alan_Fire 阅读(858) 评论(0) 推荐(0)

深度强化学习资源介绍

摘要：加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文，该论文概述了在深度强化学习（Deep Reinforcement Learning）方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进；从一年多前的 70 页扩充到现在的 150 阅读全文

posted @ 2018-11-16 12:36 Alan_Fire 阅读(459) 评论(0) 推荐(0)

Introducing Deep Reinforcement

摘要： The manuscript of Deep Reinforcement Learning is available now! It makes significant improvements to Deep Reinforcement Learning: An Overview, which h 阅读全文

posted @ 2018-11-16 12:22 Alan_Fire 阅读(347) 评论(0) 推荐(0)

2018年11月13日

库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

摘要：项目地址：https://github.com/bharathgs/Awesome-pytorch-list 列表结构： NLP 与语音处理计算机视觉概率/生成库其他库教程与示例论文实现 PyTorch 其他项目自然语言处理和语音处理该部分项目涉及语音识别、多说话人语音处理、机器翻译、阅读全文

posted @ 2018-11-13 23:07 Alan_Fire 阅读(768) 评论(0) 推荐(1)

伯克利、OpenAI等提出基于模型的元策略优化强化学习

摘要：基于模型的强化学习方法数据效率高，前景可观。本文提出了一种基于模型的元策略强化学习方法，实践证明，该方法比以前基于模型的方法更能够应对模型缺陷，还能取得与无模型方法相近的性能。引言强化学习领域近期取得的很多成就都是通过无模型强化学习算法 [1,2,3] 实现的。无模型（MF）算法倾向于实现最佳性阅读全文

posted @ 2018-11-13 23:03 Alan_Fire 阅读(342) 评论(0) 推荐(0)

修改蒙特卡洛树搜索让人工智能像人类一样玩视频游戏

摘要：编者注：《吃豆人》是一款由南梦宫公司制作的街机游戏，游戏最初于1980年5月22日在日本发行。本游戏由南梦宫公司的岩谷彻设计，游戏于1980年10月由Midway Games公司在美国发行。星际争霸是由暴雪娱乐有限公司制作发行的一系列战争题材科幻游戏。游戏系列主要由Chris Metzen与Jam 阅读全文

posted @ 2018-11-13 14:18 Alan_Fire 阅读(783) 评论(0) 推荐(0)

用深度学习LSTM炒股：对冲基金案例分析

摘要：英伟达昨天一边发布“全球最大的GPU”，一边经历股价跳水20多美元，到今天发稿时间也没恢复过来。无数同学在后台问文摘菌，要不要抄一波底嘞？今天用深度学习的序列模型预测股价已经取得了不错的效果，尤其是在对冲基金中。股价数据是典型的时间序列数据。什么是序列数据呢？语音、文字等这些前后关联、存在内有顺阅读全文

posted @ 2018-11-13 14:13 Alan_Fire 阅读(1843) 评论(0) 推荐(0)

一文读懂迁移学习

摘要： 1. 前言迁移学习（Transfer Learning,TL）对于人类来说，就是掌握举一反三的学习能力。比如我们学会骑自行车后，学骑摩托车就很简单了；在学会打羽毛球之后，再学打网球也就没那么难了。对于计算机而言，所谓迁移学习，就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术。阅读全文

posted @ 2018-11-13 14:11 Alan_Fire 阅读(968) 评论(0) 推荐(0)