摘要: boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 一个模型如果是线性的,就意味着它 阅读全文
posted @ 2018-12-21 01:22 与冰 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 阅读全文
posted @ 2018-12-06 10:38 与冰 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 08:29 与冰 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯:高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮件 阅读全文
posted @ 2018-11-22 09:30 与冰 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习 (1)简述分类与聚类的联系与区别 分类就是按照某种标准给对象贴标签再根据标签来区分归类。 聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。 区别:分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练语料训练得到,属 阅读全文
posted @ 2018-11-18 19:51 与冰 阅读(543) 评论(0) 推荐(0) 编辑
摘要: 读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 from sklearn.datasets import load_sample_imagefro 阅读全文
posted @ 2018-11-04 19:13 与冰 阅读(264) 评论(0) 推荐(0) 编辑
摘要: x = np.random.randint(1,50,[20,1]) y = np.zeros(20) k = 3 def initcenter(x,k): return x[:k] kc = initcenter(x,k) kc def nearest(kc,i): d=(abs(kc-i)) w 阅读全文
posted @ 2018-10-27 11:22 与冰 阅读(147) 评论(0) 推荐(0) 编辑
摘要: # 导包 import numpy as np # 导入鸢尾花数据 from sklearn.datasets import load_iris data = load_iris() pental_len = data.data[:,2] # 计算鸢尾花花瓣长度的最大值,平均值,中值,均方差 print("最大值:",np.max(pental_len)) print("平均值:",np.m... 阅读全文
posted @ 2018-10-20 22:38 与冰 阅读(173) 评论(0) 推荐(0) 编辑
摘要:  提交作业  提交作业 (1)安装scipy,numpy,sklearn包 import numpy from sklearn.datasets import load_iris (2)从sklearn包自带的数据集中读出鸢尾花数据集data data = load_iris() (3)查看da 阅读全文
posted @ 2018-10-13 22:39 与冰 阅读(142) 评论(0) 推荐(0) 编辑
摘要: (1)时间 (2)列表 (3)自定义函数 阅读全文
posted @ 2018-09-29 11:54 与冰 阅读(161) 评论(0) 推荐(0) 编辑