摘要: 线性模型与非线性模型性能的区别: 一个模型如果是线性的,就意味着它的参数项要么是常数,要么是原参数和要预测的特征之间的乘积加和就是我们要预测的值。 线性模型计算复杂度较低,不足之处是模型拟合效果相对弱些。非线性模型拟合能力较强,不足之处是数据量不足容易过拟合,计算复杂度高,可解释性不好。 阅读全文
posted @ 2018-12-23 11:29 罗慧艳 阅读(323) 评论(1) 推荐(0) 编辑
摘要: 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 线性模型与非线性模型性能的区别: 一个模型如果是线性的 阅读全文
posted @ 2018-12-15 14:32 罗慧艳 阅读(1213) 评论(0) 推荐(0) 编辑
摘要: 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示。 4.一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 阅读全文
posted @ 2018-12-08 23:03 罗慧艳 阅读(2069) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 10:20 罗慧艳 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮 阅读全文
posted @ 2018-11-25 18:41 罗慧艳 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类:找出描述并区分数据类或概念的模型,以便能够使用模型预测类标记未知的对象类。分类的目的是把数据项映射到给定的类别的某一个类中。 聚类:将本身没有类别的样本聚集成不同的组,把这组数据对象的集合叫簇。目的是使得属于同一个簇的样 阅读全文
posted @ 2018-11-18 19:23 罗慧艳 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 1、读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 观察原始图片与新图片所占用内存的大小。 #观察原始图片和新图片的内存大小import sysp 阅读全文
posted @ 2018-11-01 11:49 罗慧艳 阅读(599) 评论(1) 推荐(0) 编辑
摘要: 1)选取初始数据中的k个对象作为初始的中心,每个对象代表一个聚类中心: 2) 3) 4) 2.鸢尾花花瓣长度做聚类分析并用散点图显示出来 3.用sklearm包的kmeans对鸢尾花的花瓣进行分析用散点图显示 4.完整的鸢尾花数据分析用散点图显示 阅读全文
posted @ 2018-10-27 23:12 罗慧艳 阅读(6274) 评论(1) 推荐(0) 编辑
摘要: #计算鸢尾花的花瓣长度的最大值,均值,中值,均方差 from sklearn.datasets import load_iris data=load_iris() data_length=data.data[:,2] print("最大值:",np.max(data_length),"\n","平均值:",np.mean(data_length),"\n","中值:",np.median(dat... 阅读全文
posted @ 2018-10-20 22:19 罗慧艳 阅读(586) 评论(0) 推荐(0) 编辑
摘要: 1、安装scipy,numpy,sklearn包; 2、从sklearn包自带的数据集读话的数据集; 3、查看数据类型 4、取出花的特性和类别数据,查看数据类型 5、取出所有花花萼的长度 6、取出所有花花瓣的长度和宽带 7、取出某朵花的四个特征和类别 8、将所有花分成三个组,每组50个 9、生成新的 阅读全文
posted @ 2018-10-13 15:57 罗慧艳 阅读(236) 评论(0) 推荐(0) 编辑