Atitit nlp用到的技术与常见类库 目录 1. 常用的技术 1 1.1. 语言处理基础技术 分词 相似度等 1 1.2. 新闻摘要 2 1.3. 情感倾向分析 2 1.4. 文章标签 2 1.

Atitit nlp用到的技术与常见类库

 

目录

1. 常用的技术 1

1.1. 语言处理基础技术 分词 相似度等 1

1.2. 新闻摘要 2

1.3. 情感倾向分析 2

1.4. 文章标签 2

1.5. 文章分类 2

1.6. 文本审核 2

1.7. 机器翻译 2

1.8. 智能写作平台 3

2. Ati常用技术 3

2.1. 分词  关键词提取 3

2.2. 摘要 关键词提取 与目录提取 3

2.3. 抽取 3

2.4. 索引与 检索 3

2.5. Zip压缩文档抽取技术 3

2.6. Office pdf系列文档读取技术 3

2.7. Eml html系列温暖的读取技术 3

3. Nlp常用类库 3

3.1. Mmseg分词, 3

3.2. 文档读取处理类 3

3.3. 索引与检索类 4

4. Ref 4

 

  1. 常用的技术

 

 

    1. 语言处理基础技术 分词 相似度等

词法分析

依存句法分析

 

词向量表示

DNN语言模型

 

词义相似度

短文本相似度

语言处理应用技术

文本纠错

对话情绪识别

    1. 新闻摘要

 

    1. 情感倾向分析
    2. 文章标签

 

评论观点抽取

    1. 文章分类
    2. 文本审核
    3. 机器翻译

通用翻译API

拍照翻译SDK

 

定制化翻译API

垂直领域API

 

语音翻译SDK

语种识别API

    1. 智能写作平台
  1. Ati常用技术
    1. 分词  关键词提取  
    2. 摘要 关键词提取 与目录提取

Html文档摘要提取

    1. 抽取
    2. 索引与 检索
    3. Zip压缩文档抽取技术
    4. Office pdf系列文档读取技术
    5. Eml html系列温暖的读取技术
  1. Nlp常用类库
    1. Mmseg分词,
    2. 文档读取处理类

mail类库,poi类库(处理officex系列),jsoup html类库。

org.apache.tools.zip_1.9.6   处理zip库

java-unrar  处理rar文档

pdfbox-1.8.16.jar

    1. 索引与检索类

Lucence    imap类库mail。Jar    zip库读取库

  1. Ref

百度ai

 

Atitit nlp   自然语言处理的艺术 attilax著作 v2 t55.docx

Atitit nlp   自然语言处理attilax总结 dep

posted @ 2019-05-22 09:16  attilaxAti  阅读(27)  评论(0编辑  收藏  举报