中文信息处理-1-概述
------------恢复内容开始------------
基本概念
自然语言处理的两大研究内容:
- 自然语言理解
- 理解的标准:问答;文摘生成;释义;翻译
- 自然语言生成
发展历史
-
上世纪60年代:基于规则,代表系统SIR ELIZA
-
上世纪70年代:基于规则,代表系统 LUNAR
-
上世纪80年代:基于统计
-
2014年后:基于深度学习
中文信息处理是NLP领域的一个重要分支,研究起步比较晚:
- 汉字输入问题:仓颉码解决
- 分词问题:一定程度上解决
- 句法分析问题:仍然很困难
应用领域
- 机器翻译:实现一种语言到另一种语言的翻译
- 自动文摘:将原文档的主要内容或某方面的信息自动提取出来,实例如百度新闻摘要Demo
- 信息检索。如各种搜索引擎,面向多语言的信息检索称为跨语言检索
- 文档分类。利用计算机系统对大量的文档按照一定的分类标准自动归类
- 信息推荐和过滤
- 问答系统:利用自动推理等手段,在有关知识资源中自动求解答案并对人提出的问题解答。
相关资源
国外研究机构:
- Stanford University/MIT/Carnegie Mellon University
- John Hopkins University
- The University of Southern California
- The University of Pennsylvania, …
主要学术会议:
-
ACL:The Association for Computational Linguistics, https://www.aclweb.org/portal
-
EMNLP:Conference on Empirical Methods in Natural Language Processing, http://emnlp2019.org
-
NAACL:The North American Chapter of the Association for Computational Linguistics,http://naacl.org
-
COLING: International Conference on Computational Linguistics,http://coling2019.org
网络资源:
CS224d Deep Learning for Natural Language Processing
------------恢复内容结束------------

浙公网安备 33010602011771号