Loading

TF-ITF

TF-ITF

TF-ITF = TF(x) * IDF(x)

或者

文档与文章就是一回事。

举例子:

corpus = [
    'this is the first document',
    'this is the second second document',
    'and the third one',
    'is this the first document'
]

一共四个文档,this在第一个文档中的tf=1/5。itf=lg(4/3+1),其中分子的4表示一共四个文档,分子的3表示四个文档中有三个文档出现this。

posted @ 2022-10-27 09:48  system_T  阅读(105)  评论(0)    收藏  举报