词的量化
摘要:1 词袋模型(Bag of Words,简称BoW) 词袋模型假设我们不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重. 词袋模型的三部曲:分词(tokenizing),统计修订词特征值(counting)与标准化(normalizing)。 词集模型(Set of Words,简称SoW
阅读全文
posted @ 2022-03-14 16:36
posted @ 2022-03-14 16:36
posted @ 2022-03-14 15:56
posted @ 2022-03-14 15:38