摘要: 一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 二、中文文本分类 分别建立中 阅读全文
posted @ 2018-12-20 20:33 郑裕莹 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 回归模型与房价预测 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 #导入房价数据集 from sklearn.datasets impor 阅读全文
posted @ 2018-12-06 11:31 郑裕莹 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯应用:垃圾邮件分类 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词 阅读全文
posted @ 2018-12-06 10:30 郑裕莹 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮 阅读全文
posted @ 2018-11-22 10:54 郑裕莹 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类——分类是根据文本的特征或属性,划分到已有的类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。 聚类——聚类是事先不知道数据会分为几类,通过分析将数据或 阅读全文
posted @ 2018-11-18 21:58 郑裕莹 阅读(125) 评论(0) 推荐(0) 编辑
摘要: K-means算法应用:图片压缩 读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 观察原始图片与新图片所占用内存的大小。 将原始图片与新图片保存成 阅读全文
posted @ 2018-11-07 13:42 郑裕莹 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用 1.用python实现K均值算法 K-means是一个反复迭代的过程,算法分为四个步骤:(x,k,y) 2. 鸢尾花花瓣长度数据做聚类并用散点图显示。 3. 用sklearn.cluster.KMeans,鸢尾花花瓣长度 阅读全文
posted @ 2018-10-31 20:25 郑裕莹 阅读(115) 评论(0) 推荐(0) 编辑
摘要: numpy统计分布显示 1、计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。 import numpy as np from sklearn.datasets import load_iris data = load_iris() petal_length = data['data'][:,2] 阅读全文
posted @ 2018-10-21 20:30 郑裕莹 阅读(131) 评论(0) 推荐(0) 编辑
摘要: numpy数据集练习(10.11) 1.安装scipy,numpy,sklearn包 2. 从sklearn包自带的数据集中读出鸢尾花数据集data 3.查看data类型,包含哪些数据 运行结果: 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 运行结果: 5.取出所有花的花萼长度(cm) 阅读全文
posted @ 2018-10-14 13:37 郑裕莹 阅读(127) 评论(0) 推荐(0) 编辑
摘要: numpy数组及处理:效率对比 问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12+b13,a22+b23,a32+b33,·····+an2+bn3 1.用列表+循环实现,并包装成函数 2.用numpy实现,并包装成函数 3 阅读全文
posted @ 2018-10-02 00:12 郑裕莹 阅读(92) 评论(0) 推荐(0) 编辑