2021—2022学年第一学期寒假学习记录20
2022.01.20,今天是服务外包竞赛:随便拿个奖队的项目进行的第二十天,今天根据项目要求继续学习matlab数字图像处理
训练集文本:
数据样例选用Sogou实验室的文本分类数据的mini版本
类别及标号
测试数据文本:
通过观察可知,该文本预期为IT类文章
一、 实验结果
运行结果如下图
根据数据集的分类编号可知,该测试文本属于IT,与预期相符
五、遇到的困难及解决方法、心得体会
通过此次实验,让我对朴素贝叶斯有了更深刻的理解,原本只是了解基本的先验概率公式。实验过程中学习了中文的分词以及停用词的使用,使分类更加的准确,也认识到了贝叶斯广阔的实用空间,对于机器学习这门课的兴趣也更加浓厚。

浙公网安备 33010602011771号