代码改变世界

大作业

2018-12-21 10:45 by cqchenqin, 238 阅读, 0 推荐, 收藏, 编辑
摘要:一、boston房价预测:回归模型预测波士顿房价 #多元线性回归模型 from sklearn.datasets import load_boston# 导入boston房价数据集 from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatures imp... 阅读全文

回归模型与房价预测

2018-12-06 11:53 by cqchenqin, 228 阅读, 0 推荐, 收藏, 编辑
摘要:from sklearn.datasets import load_boston# 导入boston房价数据集 boston=load_boston()import numpyboston.keys()#查看每一个key值 print(boston.DESCR) boston.data.shape import pandas as pd pd.DataFrame(boston... 阅读全文

朴素贝叶斯应用:垃圾邮件分类

2018-11-29 11:57 by cqchenqin, 381 阅读, 0 推荐, 收藏, 编辑
摘要:import csv # 读数据 file_path = r'data\EmailData.txt' EmailData = open(file_path,'r',encoding='utf-8') Email_data = [] Email_target = [] csv_reader = csv.reader(EmailData,delimiter='\t') # 将数据分别存入数据列表和目... 阅读全文

sklearn中的朴素贝叶斯模型及其应用

2018-11-22 22:51 by cqchenqin, 556 阅读, 0 推荐, 收藏, 编辑
摘要:一、使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯:高斯分布型、伯努利型、多项式型 #①高斯分布型 from sklearn import datasets iris=datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb=GaussianNB()#构造建立模型 pred=gnb.... 阅读全文

分类与监督学习,朴素贝叶斯分类算法

2018-11-18 19:35 by cqchenqin, 624 阅读, 0 推荐, 收藏, 编辑
摘要:1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 联系: ①聚类分析是研究如何在没有训练的条件下把样本划分为若干类。 ②在分类中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。 ③聚类需要解决的问题是将已给定的若干无标记的模式聚集起来 阅读全文

K-means算法应用:图片压缩

2018-11-06 19:04 by cqchenqin, 298 阅读, 0 推荐, 收藏, 编辑
摘要:#1、读取一张示例图片或自己准备的图片,观察图片存放数据特点。 from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import matplotlib.image as img import numpy as np chi... 阅读全文

作业8

2018-10-27 12:02 by cqchenqin, 228 阅读, 0 推荐, 收藏, 编辑
摘要:#1.用python实现K均值算法:K-means是一个反复迭代的过程,算法分为四个步骤:#(1)选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心;import numpy as npx=np.random.randint(1,100,[20,1])y=np.zeros(20)k=3#初始聚类中心数组def initcenter(x,k): return x[0:k].res... 阅读全文

作业7

2018-10-18 11:50 by cqchenqin, 213 阅读, 0 推荐, 收藏, 编辑
摘要:#计算数组的最大值,最小值,平均值,标准差,中位数 import numpy as np a=np.random.random(20) print(np.max(a)) print(np.min(a)) print(np.mean(a)) print(np.std(a)) print(np.median(a)) #计算鸢尾花花瓣长度的最大值,平均值,中值,均方差 from sklearn.dat... 阅读全文

作业6

2018-10-14 13:22 by cqchenqin, 188 阅读, 0 推荐, 收藏, 编辑
摘要:#鸢尾花数据集#1.安装scipy,numpy,sklearn包#①python -m pip install --upgrade pip#②pip uninstall numpy#③pip uninstall scipy#④pip install scipy#⑤pip install numpy#2.从sklearn包自带的数据集中读出鸢尾花数据集datafrom sklearn.datase... 阅读全文

作业5

2018-09-29 12:03 by cqchenqin, 200 阅读, 0 推荐, 收藏, 编辑
摘要:# 数列:a1,a2,a3 ,·····,an/b1,b2,b3 ,·····,bn,求:c = a12+b13,a22+b23,a32+b33,·····+an2+bn3# 1.用列表+循环实现,并包装成函数def pySum(n): a1 = list(range(n)) b1 = list(range(0,3*n,3)) c1 = [] for i in range... 阅读全文