摘要: 词 >向量: 叫做【词向量化】, 文本向量化(vectorize)是指将文本转换为数值张量的过程 多种实现方法: 将文本分解而成的单元(单词、字符或n-gram)叫作标记(token),将文本分解成标记的过程叫作分词(tokenization) 所有文本向量化过程都是应用某种分词方案,然后将数值向量 阅读全文
posted @ 2019-09-27 17:18 大厨无盐煮 阅读(5832) 评论(1) 推荐(1)