05 2020 档案

 
作业13 垃圾邮件分类2
摘要:1.读取 sms=open("./data/SMSSpamCollection",'r',encoding='utf-8') #数据读取 sms_data=[] sms_label=[] csv_reader=csv.reader(sms,delimiter='\t') # 数据预处理 for li 阅读全文
posted @ 2020-05-23 16:51 Hqiuling 阅读(152) 评论(0) 推荐(0)
作业12 朴素贝叶斯-垃圾邮件分类
摘要:1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 # 读邮件数据集文件,提取邮件本身与标签 sms=open("./data/SMSSpamCollection",'r',encoding='utf-8') # 读取邮件 csv_reader=csv.reader(sms, del 阅读全文
posted @ 2020-05-17 15:16 Hqiuling 阅读(248) 评论(0) 推荐(0)
作业11 分类与监督学习,朴素贝叶斯分类算法
摘要:1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类:分类是已知这个数据集有多少个种类,我们需要将每一条记录分别属于哪一类标记出来; 例如:我们在对学生性别进行分类时,会将其分为“男”,“女”两类; 聚类:聚类是不知道该数据集包含了多少种类,我们需要将数据集中相似的数据归纳 阅读全文
posted @ 2020-05-10 15:13 Hqiuling 阅读(309) 评论(0) 推荐(0)