摘要: 一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 二、中文文本分类 阅读全文
posted @ 2018-12-23 15:43 duola-ling 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 阅读全文
posted @ 2018-12-08 17:43 duola-ling 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 21:14 duola-ling 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮 阅读全文
posted @ 2018-11-25 11:29 duola-ling 阅读(330) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 分类是根据规则进行的,你把这个规则建立起来後还可以运用到其他尚未分类的数据,同时还可以根据新的已有类别数据修正分类规则,不断提高其分类准确性 聚类是纯粹的根据已有数据进行系统把数据聚类,有可能聚类出来的没有实际意义,聚类 阅读全文
posted @ 2018-11-18 21:38 duola-ling 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率 理解贝叶斯定理 阅读全文
posted @ 2018-11-06 19:31 duola-ling 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 1.用python实现K均值算法 1(1) 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; 1.(2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最近的聚类中心(最相似)所对应的类; 2. 鸢尾花花瓣长度数据做聚类并用散点图显示 运行 阅读全文
posted @ 2018-10-28 20:39 duola-ling 阅读(224) 评论(0) 推荐(1) 编辑
摘要: 1.计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。 运行结果: 2.用np.random.normal()产生一个正态分布的随机数组,并显示出来。 运行结果: 3.np.random.randn()产生一个正态分布的随机数组,并显示出来。 运行结果: 4.显示鸢尾花花瓣长度的正态分布图,曲线图, 阅读全文
posted @ 2018-10-18 11:41 duola-ling 阅读(951) 评论(0) 推荐(0) 编辑
摘要: 3.运行结果: 4. 运行结果: 5. 运行结果: 6. 运行结果: 7. 运行结果: 8.运行结果: 阅读全文
posted @ 2018-10-14 16:03 duola-ling 阅读(430) 评论(0) 推荐(0) 编辑
摘要: 运行结果 阅读全文
posted @ 2018-09-29 11:28 duola-ling 阅读(161) 评论(0) 推荐(0) 编辑