中文信息处理-1-概述

------------恢复内容开始------------

基本概念

自然语言处理的两大研究内容:

  • 自然语言理解
    • 理解的标准:问答;文摘生成;释义;翻译
  • 自然语言生成

发展历史

  • 上世纪60年代:基于规则,代表系统SIR ELIZA

  • 上世纪70年代:基于规则,代表系统 LUNAR

  • 上世纪80年代:基于统计

  • 2014年后:基于深度学习

中文信息处理是NLP领域的一个重要分支,研究起步比较晚:

  • 汉字输入问题:仓颉码解决
  • 分词问题:一定程度上解决
  • 句法分析问题:仍然很困难

应用领域

  1. 机器翻译:实现一种语言到另一种语言的翻译
  2. 自动文摘:将原文档的主要内容或某方面的信息自动提取出来,实例如百度新闻摘要Demo
  3. 信息检索。如各种搜索引擎,面向多语言的信息检索称为跨语言检索
  4. 文档分类。利用计算机系统对大量的文档按照一定的分类标准自动归类
  5. 信息推荐和过滤
  6. 问答系统:利用自动推理等手段,在有关知识资源中自动求解答案并对人提出的问题解答。

相关资源

国外研究机构:

  • Stanford University/MIT/Carnegie Mellon University
  • John Hopkins University
  • The University of Southern California
  • The University of Pennsylvania, …

主要学术会议:

网络资源:

CS224d Deep Learning for Natural Language Processing

------------恢复内容结束------------

posted @ 2021-04-02 13:33  tlamm  阅读(239)  评论(0)    收藏  举报