摘要: 我们使用词在文本中出现的次数作为特征值,这个特征值我们也称为词权重。除了使用次数,一般还有三种方法: 1.Bool 表示:即词在文本中出现过则记为 1,没出现则记为 0,忽略了词出现的次数。 2. 词频(Term Frequency):就是词在文本中出现的次数 TF 3. TF-IDF TF-IDF 阅读全文
posted @ 2021-05-28 20:53 ICDTAD 阅读(63) 评论(0) 推荐(0) 编辑