ml 贝叶斯算法新闻分类项目实战+词云图
停用词表 将新闻数据进行预处理
利用jieba库,进行分词
利用wordcloud制作词云图 (目前包还没下载)
利用tf—idf算法提取新闻关键字
利用LDA建模提取搜集到所有新闻的关键字
LDA建模效果来看TfidfVectorizer比CountVectorizer更好一点。
停用词表 将新闻数据进行预处理
利用jieba库,进行分词
利用wordcloud制作词云图 (目前包还没下载)
利用tf—idf算法提取新闻关键字
利用LDA建模提取搜集到所有新闻的关键字
LDA建模效果来看TfidfVectorizer比CountVectorizer更好一点。