摘要: 我一直在找一份简明的神经网络入门,然而在中文圈里并没有找到。直到我看到了这份162行的Python实现,以及对应的油管视频之后,我才觉得这就是我需要的极简入门资料。这份极简入门笔记不需要突触的图片做装饰,也不需要赘述神经网络的发展历史;要推导有推导,要代码有代码,关键是,它们还对得上。对于欠缺的背景 阅读全文
posted @ 2018-11-16 22:55 Alan_Fire 阅读(1090) 评论(0) 推荐(0)
摘要: 前言 人类总是在生活中摸索规律,把规律总结为经验,再把经验传给后人,让后人发现更多的规规律,每一次知识的传递都是一次进化的过程,最终会形成了人类的智慧。自然界规律,让人类适者生存地活了下来,聪明的科学家又把生物进化的规律,总结成遗传算法,扩展到了更广的领域中。 本文将带你走进遗传算法的世界。 目录 阅读全文
posted @ 2018-11-16 22:39 Alan_Fire 阅读(4207) 评论(1) 推荐(2)
摘要: 一. 爬山算法 ( Hill Climbing ) 介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。 爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点 阅读全文
posted @ 2018-11-16 22:30 Alan_Fire 阅读(583) 评论(0) 推荐(0)
摘要: 本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型。研究人员使用 tf.keras、OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advantage Actor Critic,A3C)算法的智能体,通过 A3C 的实现解决了 CartPol 阅读全文
posted @ 2018-11-16 18:27 Alan_Fire 阅读(2682) 评论(0) 推荐(0)
摘要: 伯克利曾经提出 DeepMimic 框架,让智能体模仿参考动作片段来学习高难度技能。但这些参考片段都是经过动作捕捉合成的高度结构化数据,数据本身的获取需要很高的成本。而近日,他们又更进一步,提出了可以直接模仿 Youtube 视频人物高难度动作的新框架 SFV。 从 YouTube 视频中学习技能的 阅读全文
posted @ 2018-11-16 13:03 Alan_Fire 阅读(848) 评论(0) 推荐(0)
摘要: 加拿大阿尔伯塔大学计算机系博士 Yuxi Li 的深度强化学习综述论文,该论文概述了在深度强化学习(Deep Reinforcement Learning)方面喜人的进展。而这本刚上线的《深度强化学习》手稿对前面的版本《深度强化学习综述》做了大规模的改进;从一年多前的 70 页扩充到现在的 150 阅读全文
posted @ 2018-11-16 12:36 Alan_Fire 阅读(452) 评论(0) 推荐(0)
摘要: The manuscript of Deep Reinforcement Learning is available now! It makes significant improvements to Deep Reinforcement Learning: An Overview, which h 阅读全文
posted @ 2018-11-16 12:22 Alan_Fire 阅读(344) 评论(0) 推荐(0)