随笔档案「2018年11月16日」：反向传播神经网络极简入门 ... - Alan_Fire

2018年11月16日

摘要：我一直在找一份简明的神经网络入门，然而在中文圈里并没有找到。直到我看到了这份162行的Python实现，以及对应的油管视频之后，我才觉得这就是我需要的极简入门资料。这份极简入门笔记不需要突触的图片做装饰，也不需要赘述神经网络的发展历史；要推导有推导，要代码有代码，关键是，它们还对得上。对于欠缺的背景阅读全文

posted @ 2018-11-16 22:55 Alan_Fire 阅读(1096) 评论(0) 推荐(0)

R语言中的遗传算法详细解析

摘要：前言人类总是在生活中摸索规律，把规律总结为经验，再把经验传给后人，让后人发现更多的规规律，每一次知识的传递都是一次进化的过程，最终会形成了人类的智慧。自然界规律，让人类适者生存地活了下来，聪明的科学家又把生物进化的规律，总结成遗传算法，扩展到了更广的领域中。本文将带你走进遗传算法的世界。目录阅读全文

posted @ 2018-11-16 22:39 Alan_Fire 阅读(4215) 评论(1) 推荐(2)

模拟退火算法

摘要：一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前，先介绍爬山算法。爬山算法是一种简单的贪心搜索算法，该算法每次从当前解的临近解空间中选择一个最优解作为当前解，直到达到一个局部最优解。爬山算法实现很简单，其主要缺点是会陷入局部最优解，而不一定能搜索到全局最优解。如图1所示：假设C点阅读全文

posted @ 2018-11-16 22:30 Alan_Fire 阅读(584) 评论(0) 推荐(0)

TensorFlow利用A3C算法训练智能体玩CartPole游戏

摘要：本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型。研究人员使用 tf.keras、OpenAI 训练了一个使用「异步优势动作评价」（Asynchronous Advantage Actor Critic，A3C）算法的智能体，通过 A3C 的实现解决了 CartPol 阅读全文

posted @ 2018-11-16 18:27 Alan_Fire 阅读(2688) 评论(0) 推荐(0)

伯克利推出「看视频学动作」的AI智能体

摘要：伯克利曾经提出 DeepMimic 框架，让智能体模仿参考动作片段来学习高难度技能。但这些参考片段都是经过动作捕捉合成的高度结构化数据，数据本身的获取需要很高的成本。而近日，他们又更进一步，提出了可以直接模仿 Youtube 视频人物高难度动作的新框架 SFV。从 YouTube 视频中学习技能的阅读全文

posted @ 2018-11-16 13:03 Alan_Fire 阅读(858) 评论(0) 推荐(0)

深度强化学习资源介绍

摘要：加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文，该论文概述了在深度强化学习（Deep Reinforcement Learning）方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进；从一年多前的 70 页扩充到现在的 150 阅读全文

posted @ 2018-11-16 12:36 Alan_Fire 阅读(459) 评论(0) 推荐(0)

Introducing Deep Reinforcement

摘要： The manuscript of Deep Reinforcement Learning is available now! It makes significant improvements to Deep Reinforcement Learning: An Overview, which h 阅读全文

posted @ 2018-11-16 12:22 Alan_Fire 阅读(347) 评论(0) 推荐(0)