2021 年 3月 29 日随笔档案 - 旁人怎会懂

2021年3月29日

验证已建立的tf-idf(TfidfVectorizer)模型对新文本进行量化的过程

摘要： from sklearn.feature_extraction.text import TfidfVectorizer test_a = ['天天爱 LOL', '爱玩游戏', '我是男生', '男生 ', '爸爸也爱玩 lol' ] tf = TfidfVectorizer() p 阅读全文

posted @ 2021-03-29 18:22 旁人怎会懂阅读(249) 评论(0) 推荐(0)

算法模型保存与使用

摘要：在算法建立模块中进行模型保存模型保存如下： import joblib counter = joblib.load('counter_model') # 加载已建立好的词袋模型 nb = joblib.load('nb_model') # 加载已建立好的算法模型 def new_text_pre( 阅读全文

posted @ 2021-03-29 17:45 旁人怎会懂阅读(297) 评论(0) 推荐(0)

基于tf-idf的文本分类预测模型

摘要：为以后项目准备，在此写一下文本分类预测模型的完整流程，使用的多项式朴素贝叶斯算法进行预测，在其他人项目中看到使用前馈神经网络进行预测（本人目前没有使用过深度学习进行文本分类，不知道效果怎么样）目前有2个问题未解决模型建立完，怎样预测一个新的文本文件（词频向量化无法处理）？解决方案：目前使用通过阅读全文

posted @ 2021-03-29 16:30 旁人怎会懂阅读(981) 评论(0) 推荐(0)

旁人怎会懂

公告