TF-ITF
TF-ITF
TF-ITF = TF(x) * IDF(x)
或者
文档与文章就是一回事。
举例子:
corpus = [ 'this is the first document', 'this is the second second document', 'and the third one', 'is this the first document' ]
一共四个文档,this在第一个文档中的tf=1/5。itf=lg(4/3+1),其中分子的4表示一共四个文档,分子的3表示四个文档中有三个文档出现this。