摘要:
词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个,而词语“母牛”出现了3次,那么“母牛”一词在该文件中的词频就是3/100=0.03。 一个计算文件频率 (DF) 的方法是测定有多少份文件出现过“母牛”一词,然后除以文件集里包含的文件总数。所以,如果“母牛”一 阅读全文
posted @ 2018-05-09 17:25
弥漫的幻雪
阅读(125)
评论(0)
推荐(0)
2018年5月9日