W梨涡浅笑

2018年12月22日

摘要： 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型：建立13个变量与房价之间的预测模型，并检测模型好坏。 4. 多项式回归模型：建立13个变量与房价之间的预测模型，并检测模型好坏。 5. 比较线性模型与非线性模型的性能，并说明原因。代码：运行结果：性能比较：多项式模型性能比较好，在阅读全文

posted @ 2018-12-22 11:02 W梨涡浅笑阅读(239) 评论(0) 推荐(0) 编辑

2018年12月8日

回归模型与房价预测

摘要： 1. 导入boston房价数据集 2. 一元线性回归模型，建立一个变量与房价之间的预测模型，并图形化显示。 3. 多元线性回归模型，建立13个变量与房价之间的预测模型，并检测模型好坏，并图形化显示检查结果。 4. 一元多项式回归模型，建立一个变量与房价之间的预测模型，并图形化显示。代码：运行结果阅读全文

posted @ 2018-12-08 09:31 W梨涡浅笑阅读(173) 评论(0) 推荐(0) 编辑

2018年12月6日

朴素贝叶斯应用：垃圾邮件分类

摘要： 1. 数据准备：收集数据与读取 2. 数据预处理：处理数据 3. 训练集与测试集：将先验数据按一定比例进行拆分。 4. 提取数据特征，将文本解析为词向量。 5. 训练模型：建立模型，用训练数据训练模型。即根据训练样本集，计算词项出现的概率P(xi|y)，后得到各类下词汇出现概率的向量。 6. 测阅读全文

posted @ 2018-12-06 08:59 W梨涡浅笑阅读(417) 评论(0) 推荐(0) 编辑

2018年11月22日

sklearn中的朴素贝叶斯模型及其应用

摘要： 1.使用朴素贝叶斯模型对iris数据集进行花分类尝试使用3种不同类型的朴素贝叶斯：高斯分布型多项式型伯努利型代码：运行结果： 2.使用sklearn.model_selection.cross_val_score()，对模型进行验证。代码：运行结果: 阅读全文

posted @ 2018-11-22 09:58 W梨涡浅笑阅读(199) 评论(0) 推荐(0) 编辑

2018年11月17日

分类与监督学习，朴素贝叶斯分类算法

摘要： 1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别？分类与聚类：是把某个对象划分到某个具体的已经定义的类别当中，而聚类是把一些对象按照具体特征组织到若干个类别里。虽然都是把某个对象划分到某个类别中，但是分类的类别是已经预定义的，而聚类操作时，某个对象所属的类别却不是预定义的阅读全文

posted @ 2018-11-17 23:18 W梨涡浅笑阅读(145) 评论(0) 推荐(0) 编辑

2018年11月6日

K-means算法应用：图片压缩

摘要：读取一张示例图片或自己准备的图片，观察图片存放数据特点。根据图片的分辨率，可适当降低分辨率。再用k均值聚类算法，将图片中所有的颜色值做聚类。然后用聚类中心的颜色代替原来的颜色值。形成新的图片。观察原始图片与新图片所占用内存的大小。将原始图片与新图片保存成文件，观察文件的大小。代码：运阅读全文

posted @ 2018-11-06 11:15 W梨涡浅笑阅读(218) 评论(0) 推荐(0) 编辑

2018年10月28日

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用

摘要： 1.用python实现K均值算法 K-means是一个反复迭代的过程，算法分为四个步骤：（x,k,y) 1）选取数据空间中的K个对象作为初始中心，每个对象代表一个聚类中心； def initcenter(x, k): kc 2）对于样本中的数据对象，根据它们与这些聚类中心的欧氏距离，按距离最近阅读全文

posted @ 2018-10-28 15:41 W梨涡浅笑阅读(216) 评论(0) 推荐(0) 编辑

2018年10月20日

numpy统计分布显示

摘要：计算鸢尾花花瓣长度的最大值，平均值，中值，均方差。用np.random.normal()产生一个正态分布的随机数组，并显示出来。 np.random.randn()产生一个正态分布的随机数组，并显示出来。显示鸢尾花花瓣长度的正态分布图，曲线图，散点图。代码：运行结果：阅读全文

posted @ 2018-10-20 14:55 W梨涡浅笑阅读(372) 评论(0) 推荐(0) 编辑

2018年10月14日

numpy数据集练习

摘要：结果：阅读全文

posted @ 2018-10-14 14:28 W梨涡浅笑阅读(150) 评论(0) 推荐(0) 编辑

2018年9月29日

numpy数组及处理：效率对比

摘要： 1.用列表+循环实现，并包装成函数代码：运行结果： 2.用numpy实现，并包装成函数代码：运行结果： 3.对比两种方法实现的效率，给定一个较大的参数n，用运行函数前后的timedelta表示代码：运行结果：阅读全文

posted @ 2018-09-29 12:01 W梨涡浅笑阅读(536) 评论(0) 推荐(0) 编辑

公告