摘要: from sklearn.feature_extraction.text import TfidfVectorizer test_a = ['天天 爱 LOL', '爱 玩 游戏', '我 是 男生', '男生 ', '爸爸 也 爱 玩 lol' ] tf = TfidfVectorizer() p 阅读全文
posted @ 2021-03-29 18:22 旁人怎会懂 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 在算法建立模块中进行模型保存 模型保存如下: import joblib counter = joblib.load('counter_model') # 加载已建立好的词袋模型 nb = joblib.load('nb_model') # 加载已建立好的算法模型 def new_text_pre( 阅读全文
posted @ 2021-03-29 17:45 旁人怎会懂 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 为以后项目准备,在此写一下文本分类预测模型的完整流程,使用的多项式朴素贝叶斯算法进行预测,在其他人项目中看到使用前馈神经网络进行预测(本人目前没有使用过深度学习进行文本分类,不知道效果怎么样) 目前有2个问题未解决 模型建立完,怎样预测一个新的文本文件(词频向量化无法处理)? 解决方案:目前使用通过 阅读全文
posted @ 2021-03-29 16:30 旁人怎会懂 阅读(843) 评论(0) 推荐(0) 编辑