摘要: 原文地址:http://blog.sina.com.cn/s/blog_574a437f01019poo.html 资料作者:刘知远THU 初学者如何查阅自然语言处理(NLP)领域学术会议 昨天实验室一位刚进组的同学发邮件来问我如何查找学术论文,这让我想起自己刚读研究生时茫然四顾的情形:看着学长们高 阅读全文
posted @ 2018-09-13 14:28 bep_code 阅读(1463) 评论(0) 推荐(1) 编辑
摘要: 中文分词算法一般分为三类: 1.基于词表的分词算法 正向最大匹配算法FMM 逆向最大匹配算法BMM 双向最大匹配算法BM 2.基于统计模型的分词算法:基于N-gram语言模型的分词算法 3.基于序列标注的分词算法 基于HMM 基于CRF 基于深度学习的端到端的分词算法 下面介绍三类基于词表的分词算法 阅读全文
posted @ 2018-09-13 13:21 bep_code 阅读(4395) 评论(1) 推荐(0) 编辑
摘要: 近来在尝试用传统机器学习方法来做一个中文问答系统,传统机器学习方法建模其实主要的工作在于模型的特征工程,本文主要受哈工大的《中文语义角色标注的特征工程》及其参考文献的启发,分析及总结了在中文的自然语言处理任务的特征工程中可能用到的特征,以及特征提取的方法。 其实在《基于最大熵的中文阅读理解模型》中我 阅读全文
posted @ 2018-09-13 13:03 bep_code 阅读(1167) 评论(0) 推荐(0) 编辑
摘要: 来自微信公众号人工智能头条 为什么会有分词 我们知道自然语言处理中词为最小的处理单元,当你的语料为句子、短文本、篇章时,我们要做的第一步就是分词。 由于英语的基本组成单位就是词,分词是比较容易的。其句子基本上就是由标点符号、空格和词构成,那么只要根据空格和标点符号将词语分割即可。 中文和英文就有很大 阅读全文
posted @ 2018-09-13 12:43 bep_code 阅读(894) 评论(0) 推荐(0) 编辑
摘要: 1、研究方向部分 关于NLP的应用场景与领域我一直没有概念,翻博客,听视频,也都是东一榔头,西一棒槌的瞎鼓捣。我自己对于NLP的应用理解主要分为三部分: (1)基础功能部分:句法语义分析 这部分是属于NLP处理的基础部分,是一般NLP任务的首要处理问题,关于NLP的相关应用,起点都是从词法、句法开始 阅读全文
posted @ 2018-09-13 12:30 bep_code 阅读(459) 评论(0) 推荐(0) 编辑