摘要: 在 Github 上,afshinea 贡献了一个备忘录对经典的斯坦福 CS229 课程进行了总结,内容包括监督学习、无监督学习,以及进修所用的概率与统计、线性代数与微积分等知识。 项目地址:https://github.com/afshinea/stanford-cs-229-machine-le 阅读全文
posted @ 2018-10-01 02:13 Alan_Fire 阅读(203) 评论(0) 推荐(0)
摘要: 去年,OpenAI和DeepMind联手做了当时最酷的实验,不用经典的奖励信号来训练智能体,而是根据人类反馈进行强化学习的新方法。有篇博客专门讲了这个实验 Learning from Human Preferences,原始论文是《 Deep Reinforcement Learning from 阅读全文
posted @ 2018-10-01 02:08 Alan_Fire 阅读(2920) 评论(0) 推荐(0)
摘要: 8 月 19 日至 23 日,数据挖掘顶会 KDD 2018 在英国伦敦举行,昨日大会公布了最佳论文等奖项。最佳论文来自慕尼黑工业大学的研究者,他们提出了针对图深度学习模型的对抗攻击方法,是首个在属性图上的对抗攻击研究。研究者还提出了一种利用增量计算的高效算法 Nettack。此外,实验证明该攻击方 阅读全文
posted @ 2018-10-01 01:55 Alan_Fire 阅读(479) 评论(0) 推荐(0)
摘要: 近日,期刊平台 Distill 发布了谷歌研究人员的一篇文章,介绍一个适用于神经网络可视化和风格迁移的强大工具:可微图像参数化。这篇文章从多个方面介绍了该工具。 图像分类神经网络拥有卓越的图像生成能力。DeepDream [1]、风格迁移 [2] 和特征可视化 [3] 等技术利用这种能力作为探索神经 阅读全文
posted @ 2018-10-01 01:50 Alan_Fire 阅读(759) 评论(0) 推荐(0)
摘要: 【题目描述】 在各种棋中,棋子的走法总是一定的,如中国象棋中马走“日”。有一位小学生就想如果马能有两种走法将增加其趣味性,因此,他规定马既能按“日”走,也能如象一样走“田”字。他的同桌平时喜欢下围棋,知道这件事后觉得很有趣,就想试一试,在一个(100×100)的围棋盘上任选两点A、B,A点放上黑子, 阅读全文
posted @ 2018-10-01 01:42 Alan_Fire 阅读(465) 评论(0) 推荐(0)
摘要: 题目描述: 一矩形阵(n*m)列由数字0到9组成,数字1到9代表细胞,细胞的定义为沿细胞数字上下左右还是细胞数字则为同一细胞,求给定矩形阵列的细胞个数。(细胞数字指1到9) 0234500067 1034560500 2045600671 0000000089 有四个细胞 输入: 第一行输入n和m( 阅读全文
posted @ 2018-10-01 01:30 Alan_Fire 阅读(662) 评论(0) 推荐(0)
摘要: 1 前言 Deep Reinforcement Learning可以说是当前深度学习领域最前沿的研究方向,研究的目标即让机器人具备决策及运动控制能力。话说人类创造的机器灵活性还远远低于某些低等生物,比如蜜蜂。。DRL就是要干这个事,而是关键是使用神经网络来进行决策控制。 因此,考虑了一下,决定推出D 阅读全文
posted @ 2018-10-01 01:08 Alan_Fire 阅读(347) 评论(0) 推荐(0)
摘要: 本教程讲解如何使用深度强化学习训练一个可以在 CartPole 游戏中获胜的模型。研究人员使用 tf.keras、OpenAI 训练了一个使用「异步优势动作评价」(Asynchronous Advantage Actor Critic,A3C)算法的智能体,通过 A3C 的实现解决了 CartPol 阅读全文
posted @ 2018-10-01 01:05 Alan_Fire 阅读(631) 评论(0) 推荐(0)
摘要: 强化学习是如何解决问题的? 什么是强化学习算法呢,它离我们有多远?2016年和2017年最具影响力的AlphaGo大胜世界围棋冠军李世石和柯洁事件,其核心算法就用到了强化学习算法。相信很多人想了解或者转行研究强化学习算法或多或少都跟这两场赛事有联系。如今,强化学习继深度学习之后,成为学术界和工业界追 阅读全文
posted @ 2018-10-01 01:02 Alan_Fire 阅读(1925) 评论(1) 推荐(0)
摘要: 一、深度强化学习的泡沫 2015年,DeepMind的Volodymyr Mnih等研究员在《自然》杂志上发表论文Human-level control through deep reinforcement learning[1],该论文提出了一个结合深度学习(DL)技术和强化学习(RL)思想的模型 阅读全文
posted @ 2018-10-01 01:00 Alan_Fire 阅读(518) 评论(0) 推荐(0)
摘要: 通常的图像转换模型(如 StarGAN、CycleGAN、IcGAN)无法实现同时训练,不同的转换配对也不能组合。在本文中,英属哥伦比亚大学(UBC)与腾讯 AI Lab 共同提出了一种新型的模块化多域生成对抗网络架构——ModularGAN,生成的结果优于以上三种基线结果。该架构由几个可重复利用和 阅读全文
posted @ 2018-10-01 00:16 Alan_Fire 阅读(261) 评论(0) 推荐(0)
摘要: 从谷歌渐进式的架构搜索到 CMU 的可微架构搜索,利用神经网络自动搭建不同的神经网络架构已经受到广泛的关注。最近弗莱堡大学的研究者发表了一篇论文纵览不同的神经架构搜索方法,他们从神经网络的搜索空间、搜索策略以及性能评估策略等三个方向探讨了不同的思路与方法。 深度学习在感知任务中取得的成功主要归功于其 阅读全文
posted @ 2018-09-30 19:47 Alan_Fire 阅读(1429) 评论(0) 推荐(0)
摘要: 谷歌开发技术推广工程师 Laurence Moroney 在 Google Cloud Next 大会上进行了一段 42 分钟的演讲,主题是「What's New with TensorFlow?」。本文作者 Cassie Kozyrkov 对该演讲进行了总结,概括出关于 TensorFlow 的九 阅读全文
posted @ 2018-09-30 15:01 Alan_Fire 阅读(173) 评论(0) 推荐(0)
摘要: 今年 1 月,谷歌人工智能负责人 Jeff Dean(当时还是谷歌大脑负责人)与 2017 年图灵奖得主、体系结构巨擘 David Patterson(当时获奖结果尚未公布)联合发表了题为《计算机体系结构黄金时代:赋能机器学习革命》的文章。文章指出,机器学习算法正在革命性地着手解决人类社会最为巨大的 阅读全文
posted @ 2018-09-30 00:08 Alan_Fire 阅读(1448) 评论(0) 推荐(0)
摘要: 一、数据驱动型机器学习模型的问题 目前流行的机器学习方法,包括深度学习,大部分是数据驱动的方法,通过对训练集数据学习来提取知识。数据驱动型机器学习方法应用成功的前提是:从训练集数据中学习到的“知识”在样本外外推时依然适用。 当机器学习方法应用于投资领域时,一般是以历史数据作为训练集数据来训练模型,应 阅读全文
posted @ 2018-09-29 23:58 Alan_Fire 阅读(2658) 评论(0) 推荐(0)