摘要: #1.回归模型预测波士顿房价 #导入load_boston数据 from sklearn.datasets import load_boston data = load_boston() #多元线性回归模型 from sklearn.model_selection import train_test_split # 训练集与测试集划分为7:3 x_train,x_test,y_train,y... 阅读全文
posted @ 2018-12-21 18:34 曾霖 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 1 from sklearn.datasets import load_boston 2 import matplotlib.pyplot as plt 3 from sklearn.linear_model import LinearRegression 4 from sklearn.preprocessing import PolynomialFeatures 5 6 def ... 阅读全文
posted @ 2018-12-19 22:28 曾霖 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯应用:垃圾邮件分类 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词 阅读全文
posted @ 2018-12-06 21:30 曾霖 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 聚类:是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。 分类:是根据文本的特征或属性,划分到已有的类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类 阅读全文
posted @ 2018-11-19 11:37 曾霖 阅读(354) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_sample_image import matplotlib.image as img from sklearn.cluster import KMeans import numpy as np from matplotlib import pyplot as plt picture = load_sample_image(... 阅读全文
posted @ 2018-11-12 11:36 曾霖 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 安装scipy import numpy from sklearn.datasets import load_iris #从sklearn包自带的数据集中读出鸢尾花数据集data data = load_iris() #查看data类型,包含哪些数据 print('数据类型是:',type(data)) print('包含的数据有:',data.keys()) ... 阅读全文
posted @ 2018-11-05 11:29 曾霖 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类并用散点图显示. 阅读全文
posted @ 2018-10-31 20:59 曾霖 阅读(195) 评论(0) 推荐(0) 编辑
摘要: numpy数组及处理:效率对比 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12+b13,a22+b23,a32+b33,·····+an2+bn3 1.用列表+循环实现,并包装成函数 2.用numpy实现,并包装成函数 3.对比两 阅读全文
posted @ 2018-10-22 11:44 曾霖 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 总结列表,元组,字典,集合区别 列表是可变的对象,可进行动态的增加、删除、更新,用[]表示。 元组和列表在结构上没有什么区别,唯一的差异在于元组是只读的,不能修改元组用“()”表示。 字典是存储键值对数据的对象,字典的元素都是无序的,且键不能相同,可以通过键,找到值,字典最外面用大括号,每一组用冒号 阅读全文
posted @ 2018-10-08 11:43 曾霖 阅读(136) 评论(0) 推荐(0) 编辑
摘要: s = input('请输入一个名字:') print(s + ',你妈喊你回家吃饭') s = input('请输入一个名字:') print(s + ',你妈喊你回家吃饭'*3) for i in range(2,10): print('http://news.gzcc.cn/html/xiaoyuanxinwen/' + str(i) + '.html') 阅读全文
posted @ 2018-09-10 11:40 曾霖 阅读(156) 评论(0) 推荐(0) 编辑