摘要: 自然语言处理 -->计算机数据 ,计算机可以处理vector,matrix 向量矩阵。 NLTK 自然语言处理库,自带语料,词性分析,分类,分词等功能。 简单版的wrapper,比如textblob。 一 简单的文本预处理流水线 1.分词 Tokenize 长句子分成有意义的小部件。 nltk的分词 阅读全文
posted @ 2016-11-06 19:45 夏末秋凉 阅读(4930) 评论(0) 推荐(0)