会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dafeifeifei
博客园
首页
新随笔
联系
管理
订阅
2018年12月23日
期末大作业
摘要: 一、boston房价预测 一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 #
阅读全文
posted @ 2018-12-23 18:54 dafeifeifei
阅读(258)
评论(0)
推荐(0)
2018年12月15日
波士顿房价处理
摘要: 1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 1 from s
阅读全文
posted @ 2018-12-15 10:31 dafeifeifei
阅读(569)
评论(0)
推荐(0)
2018年12月3日
作业,朴素贝叶斯垃圾邮件识别
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测
阅读全文
posted @ 2018-12-03 10:54 dafeifeifei
阅读(1082)
评论(0)
推荐(0)
2018年11月26日
sklearn中的朴素贝叶斯模型及其应用
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 数据准备: 用csv读取邮件数据,分解出邮件类别及邮
阅读全文
posted @ 2018-11-26 11:37 dafeifeifei
阅读(247)
评论(0)
推荐(0)
2018年11月20日
19. 删除链表的倒数第N个节点
摘要: 给定一个链表,删除链表的倒数第 n 个节点,并且返回链表的头结点。 示例: 说明: 给定的 n 保证是有效的。 进阶: 你能尝试使用一趟扫描实现吗? 思路: 定义三个指针, p扫描整个链表,定位到最后一个元素 q定位 倒数第n个元素 node 第n-1个元素 如上图,删除q结点使用 node.nex
阅读全文
posted @ 2018-11-20 23:30 dafeifeifei
阅读(96)
评论(0)
推荐(0)
2018年11月19日
朴素贝叶斯
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏情患者的临床数据集,建立朴素贝叶斯分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病:–心梗–
阅读全文
posted @ 2018-11-19 11:40 dafeifeifei
阅读(196)
评论(0)
推荐(0)
2018年11月12日
kmeans图片压缩算法
摘要: 1. 用K-means算做图片压缩 读取一张示例图片或自己准备的图片,观察图片存放数据特点。 根据图片的分辨率,可适当降低分辨率。 再用k均值聚类算法,将图片中所有的颜色值做聚类。 然后用聚类中心的颜色代替原来的颜色值。 形成新的图片。 观察原始图片与新图片所占用内存的大小。 将原始图片与新图片保存
阅读全文
posted @ 2018-11-12 11:35 dafeifeifei
阅读(1700)
评论(0)
推荐(0)
2018年11月7日
numpy练习
摘要: 1. 安装scipy,numpy,sklearn包 2. 从sklearn包自带的数据集中读出鸢尾花数据集data 3.查看data类型,包含哪些数据 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 5.取出所有花的花萼长度(cm)的数据 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)
阅读全文
posted @ 2018-11-07 09:44 dafeifeifei
阅读(177)
评论(0)
推荐(0)
2018年11月5日
Kmeans
摘要: K-means是一个反复迭代的过程,算法分为四个步骤: 1) 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; 2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,按距离最近的准则将它们分到距离它们最近的聚类中心(最相似)所对应的类; 3) 更新聚类中心:将每个类别中所有对
阅读全文
posted @ 2018-11-05 11:27 dafeifeifei
阅读(143)
评论(0)
推荐(0)
2018年10月22日
关于datetime的处理
摘要: 一、处理日期时间 取系统时间 转换成‘2017年9月30日星期六10时28分56秒’格式字符串 ’2018-10-25 22:00‘转换成一个日期时间变量 计算两者的间隔 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12
阅读全文
posted @ 2018-10-22 10:57 dafeifeifei
阅读(223)
评论(1)
推荐(0)
下一页
公告