随笔分类 - NLP
自然语言处理
摘要:Apache OpenNLP库是一个基于机器学习的自然语言文本处理的开发工具包,它支持自然语言处理中一些共有的任务,例如:标记化、句子分割、词性标注、固有实体提取(指在句子中辨认出专有名词,例如:人名)、浅层分析(句字分块)、语法分析及指代。http://opennlp.apache.org/index.htmlFudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。FudanNLP及其包含数据集使用LGPL3.0许可证。功能(Functions)信息检索: 文本分类 新闻聚类中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间
阅读全文

浙公网安备 33010602011771号