摘要:
Term Lookup是和Term Extraction相反的一个组件。Term Extraction是为了找出term,Term Lookup是利用我们关心的term list来找出某个文本里面包含多少该关键字。 阅读全文
posted @ 2015-05-09 19:57
Jerry_Chen
阅读(135)
评论(0)
推荐(0)
摘要:
中文意思是关键词抽取,用于计算在文本中哪些词汇或者词组出现的频率最高。其实算法有两张:1)Frequency 2)TFIDFTFIDF的全称是Term Frequency and Inverse Document Frequency,是一个用于计算单词或词组在在整个文本中出现的几率。下面是这个公式的... 阅读全文
posted @ 2015-05-09 18:03
Jerry_Chen
阅读(190)
评论(0)
推荐(0)