中文信息处理-1-概述

------------恢复内容开始------------

基本概念
发展历史
应用领域
相关资源

基本概念

自然语言处理的两大研究内容：

自然语言理解
- 理解的标准：问答；文摘生成；释义；翻译
自然语言生成

发展历史

上世纪60年代：基于规则，代表系统SIR ELIZA
上世纪70年代：基于规则，代表系统 LUNAR
上世纪80年代：基于统计
2014年后：基于深度学习

中文信息处理是NLP领域的一个重要分支，研究起步比较晚：

汉字输入问题：仓颉码解决
分词问题：一定程度上解决
句法分析问题：仍然很困难

应用领域

机器翻译：实现一种语言到另一种语言的翻译
自动文摘：将原文档的主要内容或某方面的信息自动提取出来，实例如百度新闻摘要Demo
信息检索。如各种搜索引擎，面向多语言的信息检索称为跨语言检索
文档分类。利用计算机系统对大量的文档按照一定的分类标准自动归类
信息推荐和过滤
问答系统：利用自动推理等手段，在有关知识资源中自动求解答案并对人提出的问题解答。

相关资源

国外研究机构：

Stanford University/MIT/Carnegie Mellon University
John Hopkins University
The University of Southern California
The University of Pennsylvania, …

主要学术会议：

ACL：The Association for Computational Linguistics， https://www.aclweb.org/portal
EMNLP：Conference on Empirical Methods in Natural Language Processing， http://emnlp2019.org
NAACL：The North American Chapter of the Association for Computational Linguistics，http://naacl.org
COLING： International Conference on Computational Linguistics，http://coling2019.org

网络资源：

CS224d Deep Learning for Natural Language Processing

------------恢复内容结束------------

posted @ 2021-04-02 13:33 tlamm 阅读(270) 评论(0) 收藏举报

刷新页面返回顶部