摘要: 补缴作业: 3.K均值算法 https://www.cnblogs.com/miaoxiaowen/p/13053812.html 12.朴素贝叶斯-垃圾邮件分类 https://www.cnblogs.com/miaoxiaowen/p/13053874.html 原因:在家时间管理不恰当,自我管 阅读全文
posted @ 2020-06-06 11:17 缪孝文 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-06-06 10:57 缪孝文 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip 阅读全文
posted @ 2020-06-06 10:45 缪孝文 阅读(92) 评论(0) 推荐(0) 编辑