摘要: 前期准备 使用文本向量化的前提是要对文章进行分词,分词可以参考前一篇文章。然后将分好的词进行向量化处理,以便计算机能够识别文本。常见的文本向量化技术有词频统计技术、TF-IDF技术等。 词频统计技术 词频统计技术是很直观的,文本被分词之后。 用每一个词作为维度key,有单词对应的位置为1,其他为0, 阅读全文
posted @ 2017-08-15 10:55 chyq 阅读(5232) 评论(0) 推荐(0)