zhongwolin - 博客园

2018年12月17日

摘要： #多元线性回归模型from sklearn.datasets import load_boston#波士顿房价数据集data = load_boston() from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test = train_test_split(data.data,data.... 阅读全文

posted @ 2018-12-17 18:46 zhongwolin 阅读(275) 评论(0) 推荐(0)

2018年12月8日

回归模型与房价预测

摘要： from sklearn import datasets # 波士顿房价数据集 data = datasets.load_boston() import pandas as pd # 转为DataFrame dataDF = pd.DataFrame(data.data,columns=data.feature_names) dataDF # 数据可视化操作和人为的一元线性拟合 import... 阅读全文

posted @ 2018-12-08 22:31 zhongwolin 阅读(492) 评论(0) 推荐(0)

2018年12月5日

朴素贝叶斯应用：垃圾邮件分类

摘要： import csv # 读数据 file_path = r'data\EmailData.txt' EmailData = open(file_path,'r',encoding='utf-8') Email_data = [] Email_target = [] csv_reader = csv.reader(EmailData,delimiter='\t') # 将数据分别存入数据列表和目... 阅读全文

posted @ 2018-12-05 16:58 zhongwolin 阅读(372) 评论(0) 推荐(0)

2018年11月28日

sklearn中的朴素贝叶斯模型及其应用

摘要： 1.使用朴素贝叶斯模型对iris数据集进行花分类尝试使用3种不同类型的朴素贝叶斯： from sklearn.datasets import load_iris iris=load_iris() from sklearn.naive_bayes import GaussianNB #高斯分布型 gnb=GaussianNB() #构造 pred=gnb.fit(iris.data,... 阅读全文

posted @ 2018-11-28 11:29 zhongwolin 阅读(5304) 评论(0) 推荐(0)

2018年11月22日

iris数据集

摘要： from sklearn import datasets iris=datasets.load_iris() #导入的数据是一种字典形式，特征存储在iris.data中，标签存储在iris.target中 from sklearn.datasets import load_iris #从sklearn包datasets模块导入 load_iris iris=load_iris() at... 阅读全文

posted @ 2018-11-22 11:36 zhongwolin 阅读(1417) 评论(0) 推荐(0)

2018年11月18日

分类与监督学习，朴素贝叶斯分类算法

摘要： #1.理解分类与监督学习、聚类与无监督学习。 #简述分类与聚类的联系与区别。 #分类：给数据“贴标签”,提高认知效率,降低认知成本,对于分类来说，在对数据集分类时，我们是知道这个数据集是有多少种类的 #聚类：聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇（或类）中的对象之间具有较高的相似性，而不同簇中的对象具有较高的相异性 #简述什么是监督学... 阅读全文

posted @ 2018-11-18 21:38 zhongwolin 阅读(359) 评论(0) 推荐(0)

2018年11月6日

K-means算法应用：图片压缩

摘要： from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import matplotlib.image as img #image类可以用来读或存图片 china = load_sam... 阅读全文

posted @ 2018-11-06 17:58 zhongwolin 阅读(221) 评论(0) 推荐(0)

2018年11月1日

matplotlib实现数据的可视化

摘要： from sklearn.datasets import load_iris iris=load_iris() print(iris.DESCR)#显示数据集的相关描述 data=iris.data plt.plot(data[:,0],data[:,1],".")#将第一列萼片长度作为x坐标值，第二列萼片宽度作为y坐标值 plt.show() 阅读全文

posted @ 2018-11-01 11:41 zhongwolin 阅读(189) 评论(0) 推荐(0)

2018年10月25日

鸢尾花完整数据做聚类并用散点图显示.

摘要： import matplotlib.pyplot as plt import numpy as np from sklearn.datasets import load_iris iris=load_iris() X=iris.data print(X) from sklearn.cluster import KMeans est=KMeans(n_clusters=3) est.fit(... 阅读全文

posted @ 2018-10-25 20:28 zhongwolin 阅读(4689) 评论(0) 推荐(0)

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用

摘要： 1.用python实现K均值算法import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcenter(x,k): return x[:k] kc=initcenter(x,k) kc def nearest(kc,i): d=(abs(kc-i)) w=... 阅读全文

posted @ 2018-10-25 17:05 zhongwolin 阅读(5315) 评论(0) 推荐(0)

华婷

公告