摘要: #多元线性回归模型from sklearn.datasets import load_boston#波士顿房价数据集data = load_boston() from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test = train_test_split(data.data,data.... 阅读全文
posted @ 2018-12-17 18:46 zhongwolin 阅读(259) 评论(0) 推荐(0) 编辑
摘要: from sklearn import datasets # 波士顿房价数据集 data = datasets.load_boston() import pandas as pd # 转为DataFrame dataDF = pd.DataFrame(data.data,columns=data.feature_names) dataDF # 数据可视化操作和人为的一元线性拟合 import... 阅读全文
posted @ 2018-12-08 22:31 zhongwolin 阅读(452) 评论(0) 推荐(0) 编辑
摘要: import csv # 读数据 file_path = r'data\EmailData.txt' EmailData = open(file_path,'r',encoding='utf-8') Email_data = [] Email_target = [] csv_reader = csv.reader(EmailData,delimiter='\t') # 将数据分别存入数据列表和目... 阅读全文
posted @ 2018-12-05 16:58 zhongwolin 阅读(346) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: from sklearn.datasets import load_iris iris=load_iris() from sklearn.naive_bayes import GaussianNB #高斯分布型 gnb=GaussianNB() #构造 pred=gnb.fit(iris.data,... 阅读全文
posted @ 2018-11-28 11:29 zhongwolin 阅读(5246) 评论(0) 推荐(0) 编辑
摘要: from sklearn import datasets iris=datasets.load_iris() #导入的数据是一种字典形式,特征存储在iris.data中,标签存储在iris.target中 from sklearn.datasets import load_iris #从sklearn包datasets模块导入 load_iris iris=load_iris() at... 阅读全文
posted @ 2018-11-22 11:36 zhongwolin 阅读(1352) 评论(0) 推荐(0) 编辑
摘要: #1.理解分类与监督学习、聚类与无监督学习。 #简述分类与聚类的联系与区别。 #分类:给数据“贴标签”,提高认知效率,降低认知成本,对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的 #聚类:聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性 #简述什么是监督学... 阅读全文
posted @ 2018-11-18 21:38 zhongwolin 阅读(336) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import matplotlib.image as img #image类可以用来读或存图片 china = load_sam... 阅读全文
posted @ 2018-11-06 17:58 zhongwolin 阅读(199) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_iris iris=load_iris() print(iris.DESCR)#显示数据集的相关描述 data=iris.data plt.plot(data[:,0],data[:,1],".")#将第一列萼片长度作为x坐标值,第二列萼片宽度作为y坐标值 plt.show() 阅读全文
posted @ 2018-11-01 11:41 zhongwolin 阅读(174) 评论(0) 推荐(0) 编辑
摘要: import matplotlib.pyplot as plt import numpy as np from sklearn.datasets import load_iris iris=load_iris() X=iris.data print(X) from sklearn.cluster import KMeans est=KMeans(n_clusters=3) est.fit(... 阅读全文
posted @ 2018-10-25 20:28 zhongwolin 阅读(4611) 评论(0) 推荐(0) 编辑
摘要: 1.用python实现K均值算法import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcenter(x,k): return x[:k] kc=initcenter(x,k) kc def nearest(kc,i): d=(abs(kc-i)) w=... 阅读全文
posted @ 2018-10-25 17:05 zhongwolin 阅读(5258) 评论(0) 推荐(0) 编辑