摘要: 一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 1)代码如下: 结果如下: 阅读全文
posted @ 2018-12-18 21:27 四面楚歌· 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 1.导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 结果如下: 3.多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 结果如下: 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示 阅读全文
posted @ 2018-12-11 19:50 四面楚歌· 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 12:54 四面楚歌· 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类尝试使用3种不同类型的朴素贝叶斯: 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮件内容。 对邮件内容进行预处 阅读全文
posted @ 2018-11-28 19:23 四面楚歌· 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 1)简述分类与聚类的联系与区别。 联系:按照某种标准给对象贴标签,再根据标签来区分归类。 分类:相当于给数据贴标签,根据标签可以提高对数据认知的效率,降低认知成本。 聚类:是指事先没有“标签”而通过某种成因分析找出事物之间存在聚集性原因的过程。 区别:类别 阅读全文
posted @ 2018-11-22 21:57 四面楚歌· 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 1.图片压缩 最后新图片结果如下: 图片大小: 2.贝叶斯 M桶:7红3黄 N桶:1红9黄 现在:拿出了一个红球 试问:这个红球是M、N桶拿出来的概率分别是多少? 解: 设:省略. 1) P(M|A) = P(A·M) · P(M) / P(A) = (7/10 · 1/2)/ (8/20) = 7 阅读全文
posted @ 2018-11-12 11:41 四面楚歌· 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1.用python实现K均值算法 代码如下: 结果如下: 2.鸢尾花花瓣长度数据做聚类并用散点图显示。 代码如下: 结果如下: 3.鸢尾花完整数据做聚类并用散点图显示. 结果如下: 结果如下: 阅读全文
posted @ 2018-11-09 09:44 四面楚歌· 阅读(183) 评论(0) 推荐(0) 编辑
摘要: for i in iris['data']: petal_length = i[2] petal_width = i[3] print(petal_length,petal_width) 7.取出某朵花的四个特征及其类别。 import numpy as np import matplotlib.p 阅读全文
posted @ 2018-10-29 22:45 四面楚歌· 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 一.处理日期时间 (1)取系统时间: 代码如下: 结果如下: (2)转换成 "2017年9月30日星期六10时28分56秒" 格式字符串 代码如下: 结果如下: (3)2018-10-25 22:00 转换成一个日期时间变量 代码如下: 结果如下: (4)计算两者的间隔 代码如下: 结果如下: 二、 阅读全文
posted @ 2018-10-22 11:19 四面楚歌· 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 完整词频统计: 1.英文 代码如下: 结果如下: 2.中文 代码如下: 结果如下: 阅读全文
posted @ 2018-10-15 11:01 四面楚歌· 阅读(146) 评论(0) 推荐(0) 编辑