Alan_Fire - 博客园

2018年10月22日

ECCV 2018 | 给Cycle-GAN加上时间约束，CMU等提出新型视频转换方法Recycle-GAN

摘要： CMU 和 Facebook 的研究者联合进行的一项研究提出了一种新型无监督视频重定向方法 Recycle-GAN，该方法结合了时间信息和空间信息，可实现跨域转换，同时保留目标域的风格。相较于只关注空间信息的Cycle-GAN，在视频转换中Recycle-GAN的过渡效果更加自然。项目展示：htt 阅读全文

posted @ 2018-10-22 00:10 Alan_Fire 阅读(1146) 评论(0) 推荐(0)

2018年10月21日

教Alexa看懂手语，不说话也能控制语音助手

摘要： Alexa、Siri、小度……各种语音助手令人眼花缭乱，但这些设备多是针对能力健全的用户，忽略了听、说能力存在障碍的人群。本文作者敏锐地发现了这一 bug，并训练亚马逊语音助手 Alex 学会识别美式手语。项目发布之后受到社交媒体的热捧。本博文将介绍项目的底层技术以及如何使用 TensorFlow. 阅读全文

posted @ 2018-10-21 23:45 Alan_Fire 阅读(353) 评论(0) 推荐(0)

ECCV 2018 | 旷视科技提出GridFace：通过学习局部单应变换实现人脸校正

摘要：全球计算机视觉三大顶会之一 ECCV 2018（European Conference on Computer Vision）即将于 9 月 8 -14 日在德国慕尼黑拉开帷幕，旷视科技有多篇论文被此大会接收。在这篇论文中，旷视科技提出的一种通过学习局部单应变换实现人脸校正的全新方法——GridFa 阅读全文

posted @ 2018-10-21 23:38 Alan_Fire 阅读(349) 评论(0) 推荐(0)

不设目标也能通关「马里奥」的AI算法，全靠好奇心学习

摘要：在强化学习中，设计密集、定义良好的外部奖励是很困难的，并且通常不可扩展。通常增加内部奖励可以作为对此限制的补偿，OpenAI、CMU 在本研究中更近一步，提出了完全靠内部奖励即好奇心来训练智能体的方法。在 54 个环境上的大规模实验结果表明：内在好奇心目标函数和手工设计的外在奖励高度一致；随机特征也阅读全文

posted @ 2018-10-21 23:18 Alan_Fire 阅读(291) 评论(0) 推荐(0)

一些你需要知道的Python代码技巧

摘要：被人工智能捧红的 Python 已是一种发展完善且非常多样化的语言，其中肯定有一些你尚未发现的功能。本文或许能够让你学到一些新技巧。 Python 是世界上最流行、热门的编程语言之一，原因很多，比如：易于学习超高的通用性具备大量模块和库本文将分享一些使用 Python 的技巧，顺序按照 A- 阅读全文

posted @ 2018-10-21 02:17 Alan_Fire 阅读(409) 评论(0) 推荐(0)

EMNLP 2018 | 用强化学习做神经机器翻译：中山大学&MSRA填补多项空白

摘要：人工深度学习和神经网络已经为机器翻译带来了突破性的进展，强化学习也已经在游戏等领域取得了里程碑突破。中山大学数据科学与计算机学院和微软研究院的一项研究探索了强化学习在神经机器翻译领域的应用，相关论文已被 EMNLP 2018 接收，相关代码和数据集也已开源。论文地址：https://arxiv.o 阅读全文

posted @ 2018-10-21 01:38 Alan_Fire 阅读(438) 评论(0) 推荐(0)

新型无镜头相机助力计算机视觉

摘要：计算机视觉处理高分辨率的图像需要非常多的计算量，因此很多数据集的图像分辨率都非常小。而近日，工程师们用一块玻璃、一个光电探测器和一些软件，开发了一种「透视」相机，这种不带镜头的相机能拍摄分辨率非常小的图像，并抽象出物体的主要轮廓。因此使用这种相机拍摄的图像能大量降低计算机视觉所需要的计算力。同时，他阅读全文

posted @ 2018-10-21 01:37 Alan_Fire 阅读(296) 评论(0) 推荐(0)

微软&中科大提出新型自动神经架构设计方法NAO

摘要：近期，来自微软和中国科学技术大学的刘铁岩等人发表论文，介绍了一种新型自动神经架构设计方法 NAO，该方法由三个部分组成：编码器、预测器和解码器。实验证明，该方法所发现的架构在 CIFAR-10 上的图像分类任务和 PTB 上的语言建模任务中都表现强劲，在计算资源明显减少的情况下优于或持平于之前的架构阅读全文

posted @ 2018-10-21 01:28 Alan_Fire 阅读(276) 评论(0) 推荐(0)

机器学习=「新瓶装旧酒」的数据统计？

摘要：最近，关于深度学习和人工智能的一个梗在社交媒体上广为流传，认为二者只是墙上一道镶了崭新边框的裂缝，暗讽机器学习只是重新包装过的统计学，本质上是「新瓶装旧酒」。然而事实真的是这样吗？本文对这种看法提出了异议，认为机器学习 ≠ 数据统计，深度学习为我们处理复杂的非结构化数据问题做出了重大贡献，而人工智能阅读全文

posted @ 2018-10-21 01:16 Alan_Fire 阅读(203) 评论(0) 推荐(0)

腾讯优图联手Science发布主题报告：计算机视觉的研发和应用

摘要：近日，腾讯优图与《科学》（Science）杂志共同发布《Seeing is believing: R&D applications of computer vision》（眼见为实：计算机视觉的研发和应用）主题报告，通过全球计算机视觉领域的专家访谈，为大众带来当下计算机视觉技术发展的全面解读，也为即阅读全文

posted @ 2018-10-21 01:09 Alan_Fire 阅读(230) 评论(0) 推荐(0)

2018年10月18日

在全景视频中预测头部运动：一种深度强化学习方法

摘要：阅读全文

posted @ 2018-10-18 14:19 Alan_Fire 阅读(364) 评论(0) 推荐(0)

2018年10月15日

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

摘要：细粒度识别一般需要模型识别非常精细的子类别，它基本上就是同时使用图像全局信息和局部信息的分类任务。在本论文中，研究者们提出了一种新型层次语义框架，其自顶向下地由全局图像关注局部特征或更具判别性的区域。人类在识别物体类别时，往往不仅仅根据其外观信息，还依赖于在日常生活以及专业学习过程中获取的先验知识阅读全文

posted @ 2018-10-15 10:20 Alan_Fire 阅读(759) 评论(0) 推荐(0)

深度学习中的Normalization模型

摘要： Batch Normalization（简称 BN）自从提出之后，因为效果特别好，很快被作为深度学习的标准工具应用在了各种场合。BN 大法虽然好，但是也存在一些局限和问题，诸如当 BatchSize 太小时效果不佳、对 RNN 等动态网络无法有效应用 BN 等。针对 BN 的问题，最近两年又陆续有基阅读全文

posted @ 2018-10-15 10:13 Alan_Fire 阅读(462) 评论(0) 推荐(0)

普适注意力：用于机器翻译的2D卷积神经网络，显著优于编码器-解码器架构

摘要：现有的当前最佳机器翻译系统都是基于编码器-解码器架构的，二者都有注意力机制，但现有的注意力机制建模能力有限。本文提出了一种替代方法，这种方法依赖于跨越两个序列的单个 2D 卷积神经网络。该网络的每一层都会根据当前生成的输出序列重新编码源 token。因此类似注意力机制的属性适用于整个网络。该模型得到阅读全文

posted @ 2018-10-15 10:03 Alan_Fire 阅读(433) 评论(0) 推荐(0)

「房间里的大象」：让目标检测器一脸懵逼

摘要：可靠的图像理解系统对于自动驾驶、医学成像等应用至关重要。对抗样本被认为是一种有针对性的小型扰动。约克大学和多伦多大学的研究者在本文中展示了另一种扰动。与对抗样本相反，这些扰动不受范数的约束。它们把一幅图像中的物体放置（「移植」）到另一幅图像的新位置。这种做法对目标检测器的结果有多种非局部影响，比如房阅读全文

posted @ 2018-10-15 09:58 Alan_Fire 阅读(154) 评论(0) 推荐(0)