美团:WSDM Cup 2019自然语言推理任务获奖解题思路
摘要:WSDM(Web Search and Data Mining,读音为Wisdom)是业界公认的高质量学术会议,注重前沿技术在工业界的落地应用,与SIGIR一起被称为信息检索领域的Top2。 刚刚在墨尔本结束的第12届WSDM大会传来一个好消息,由美团搜索与NLP部NLP中心的刘帅朋、刘硕和任磊三位
阅读全文
posted @
2019-06-13 12:16
Alan_Fire
阅读(719)
推荐(0)
ERNIE:知识图谱结合BERT才是「有文化」的语言模型
摘要:自然语言表征模型最近受到非常多的关注,很多研究者将其视为 NLP 最重要的研究方向之一。例如在大规模语料库上预训练的 BERT,它可以从纯文本中很好地捕捉丰富的语义模式,经过微调后可以持续改善不同 NLP 任务的性能。因此,我们获取 BERT 隐藏层表征后,可用于提升自己任务的性能。 但是,已有的预
阅读全文
posted @
2019-05-30 23:31
Alan_Fire
阅读(1502)
推荐(0)
常见26种NLP任务的练手项目
摘要:经常有人问我:老大让我完成xxx,我不会,他也不会,但是很着急。这个任务怎么实现啊?这个任务需要什么技术啊?这种情况我遇到有100+次了,而且很多时候问得问题跟具体需要的技术简直是驴唇不对马嘴。所以今天整理了常见的30种NLP任务非常适合练手的Project,我觉得有俩作用:研究+练手,加深理解,做
阅读全文
posted @
2019-03-29 22:22
Alan_Fire
阅读(3246)
推荐(2)
2018年自然语言处理最值得关注的研究、论文和代码
摘要:2018年对于自然语言处理(NPL)是很有意义的一年,见证了许多新的研究方向和尖端成果。Elvis Saravia 是计算语言学专家,也是2019 计算语言学会年度大会北美分部的项目委员之一。他总结了2018年 NLP 的重要进展,包括增强学习、情感分析和深度学习等领域。点击文章中的链接,可获得每一
阅读全文
posted @
2019-03-29 22:18
Alan_Fire
阅读(457)
推荐(0)
项目实战:如何构建知识图谱
摘要:实践了下怎么建一个简单的知识图谱,两个版本,一个从 0 开始(start from scratch),一个在 CN-DBpedia 基础上补充,把 MySQL,PostgreSQL,Neo4j 数据库都尝试了下。自己跌跌撞撞摸索可能踩坑了都不知道,欢迎讨论。 1. CN-DBpedia 构建流程 知
阅读全文
posted @
2019-03-29 13:37
Alan_Fire
阅读(4050)
推荐(1)
干货 | 100+个NLP数据集大放送,再不愁数据!
摘要:奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化的文本数据),快去按图索骥下载数据自己研究吧! 数据集 Apache软件基金会公开邮件档案:截止到2011年7月11日全部公开可用的Apache软件基金会邮件档案。(200 GB) http://aws.amazon.com/
阅读全文
posted @
2019-03-28 12:24
Alan_Fire
阅读(1667)
推荐(0)
Sebastian Ruder : NLP 领域知名博主博士论文面向自然语言处理的神经网络迁移学习
摘要:Sebastian Ruder 博士的答辩 PPT《Neural Transfer Learning for Natural Language Processing》介绍了面向自然语言的迁移学习的动机、研究现状、缺陷以及自己的工作。 Sebastian Ruder 博士在 PPT 中阐述了使用迁移学
阅读全文
posted @
2019-03-27 23:08
Alan_Fire
阅读(1026)
推荐(0)
自然语言处理领域重要论文&资源全索引
摘要:GitHub 项目链接:https://github.com/Kyubyong/nlp_tasks 本人从事自然语言处理任务(NLP)的研究已经有很长时间了,有一天我想到,我需要为庞大的 NLP领域做一个概览,我知道自己肯定不是想要一睹 NLP 任务的全貌的第一个人。 我曾竭尽所能的研究过尽可能多种
阅读全文
posted @
2019-03-25 23:59
Alan_Fire
阅读(2164)
推荐(0)
文本分类过程中的朴素贝叶斯多项式与伯努力模型
摘要:1文本分类过程 例如文档:Good good study Day day up可以用一个文本特征向量来表示,x=(Good, good, study, Day, day , up)。在文本分类中,假设我们有一个文档d∈X,类别c又称为标签。我们把一堆打了标签的文档集合<d,c>作为训练样本,<d,c
阅读全文
posted @
2018-11-26 10:10
Alan_Fire
阅读(2788)
推荐(1)
用深度学习解决自然语言处理中的7大问题,文本分类、语言建模、机器翻译
摘要:摘要: 本文讲的是用深度学习解决自然语言处理中的7大问题,文本分类、语言建模、机器翻译等,自然语言处理领域正在从统计学方法转向神经网络方法。在自然语言中,仍然存在许多具有挑战性的问题。但是,深度学习方法在某些特定的语言问题上取得了state-of-the-art的结果。 本文讲的是用深度学习解决自然
阅读全文
posted @
2018-11-19 09:54
Alan_Fire
阅读(731)
推荐(0)
NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿
摘要:Github https://github.com/sebastianruder/NLP-progress 官方网址 https://nlpprogress.com/ Github https://github.com/sebastianruder/NLP-progress https://gith
阅读全文
posted @
2018-11-18 22:29
Alan_Fire
阅读(782)
推荐(0)
李航教授展望自然语言对话领域:现状与未来
摘要:作者:李航 字节跳动 AI Lab 原华为诺亚方舟实验室主任、现已加入字节跳动 AI Lab的李航教授近日发表博客,对自然语言对话领域的现状和最新进展进行总结,并展望了未来的走向。本文内容朴实,既重视整体格局和跨领域思维,又能着眼于现实条件,富有启发性。 1. 引言 语音助手、智能客服、智能音箱、聊
阅读全文
posted @
2018-11-13 09:33
Alan_Fire
阅读(324)
推荐(0)
MIT提出精细到头发丝的语义分割技术,打造效果惊艳的特效电影
摘要:来自 MIT CSAIL 的研究人员开发了一种精细程度远超传统语义分割方法的「语义软分割」技术,连头发都能清晰地在分割掩码中呈现。在对比实验中,他们的结果远远优于 PSPNet、Mask R-CNN、spectral matting 等基准。这项技术对于电影行业的 CGI 技术具有重大意义,精细的分
阅读全文
posted @
2018-10-01 10:14
Alan_Fire
阅读(1075)
推荐(0)