摘要:
一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 二、中文文本分类
阅读全文
posted @ 2018-12-23 15:43
duola-ling
阅读(191)
推荐(0)
摘要:
1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。
阅读全文
posted @ 2018-12-08 17:43
duola-ling
阅读(128)
推荐(0)
摘要:
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测
阅读全文
posted @ 2018-12-06 21:14
duola-ling
阅读(173)
推荐(0)
摘要:
1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮
阅读全文
posted @ 2018-11-25 11:29
duola-ling
阅读(346)
推荐(0)
摘要:
1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 分类是根据规则进行的,你把这个规则建立起来後还可以运用到其他尚未分类的数据,同时还可以根据新的已有类别数据修正分类规则,不断提高其分类准确性 聚类是纯粹的根据已有数据进行系统把数据聚类,有可能聚类出来的没有实际意义,聚类
阅读全文
posted @ 2018-11-18 21:38
duola-ling
阅读(305)
推荐(0)
摘要:
读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率 理解贝叶斯定理
阅读全文
posted @ 2018-11-06 19:31
duola-ling
阅读(180)
推荐(0)
摘要:
1.用python实现K均值算法 1(1) 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; 1.(2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最近的聚类中心(最相似)所对应的类; 2. 鸢尾花花瓣长度数据做聚类并用散点图显示 运行
阅读全文
posted @ 2018-10-28 20:39
duola-ling
阅读(257)
推荐(1)
摘要:
1.计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。 运行结果: 2.用np.random.normal()产生一个正态分布的随机数组,并显示出来。 运行结果: 3.np.random.randn()产生一个正态分布的随机数组,并显示出来。 运行结果: 4.显示鸢尾花花瓣长度的正态分布图,曲线图,
阅读全文
posted @ 2018-10-18 11:41
duola-ling
阅读(966)
推荐(0)
摘要:
3.运行结果: 4. 运行结果: 5. 运行结果: 6. 运行结果: 7. 运行结果: 8.运行结果:
阅读全文
posted @ 2018-10-14 16:03
duola-ling
阅读(451)
推荐(0)
posted @ 2018-09-29 11:28
duola-ling
阅读(169)
推荐(0)