摘要: jieba分词中Tokenize的使用,Tokenize主要是用来返回词语在原文的弃之位置,下面贴上代码: 运行结果为: 阅读全文
posted @ 2017-09-22 17:44 ybf&yyj 阅读(259) 评论(0) 推荐(0)
摘要: 结巴分词系统中实现了两种关键词抽取法,一种是TF-IDF关键词抽取算法另一种是TextRank关键词抽取算法,它们都是无监督的算法。 以下是两种算法的使用: 运行结果为: TF-IDF算法分析 TF-IDF全称是:Term Frequency-- Inverse Document Frequency 阅读全文
posted @ 2017-09-22 17:10 ybf&yyj 阅读(364) 评论(0) 推荐(0)