ml 贝叶斯算法新闻分类项目实战+词云图

停用词表   将新闻数据进行预处理

利用jieba库,进行分词

利用wordcloud制作词云图 (目前包还没下载)

利用tf—idf算法提取新闻关键字

利用LDA建模提取搜集到所有新闻的关键字

LDA建模效果来看TfidfVectorizer比CountVectorizer更好一点。

 

posted @ 2018-09-13 11:58  ivanthor  阅读(257)  评论(0)    收藏  举报