摘要: 二、中文文本分类 1.读取清洗分词 2.预测评估 3.对比 4.图像对比 阅读全文
posted @ 2018-12-17 09:57 张龙坤 阅读(240) 评论(0) 推荐(0) 编辑
摘要: #导入boston房价数据集 from sklearn.datasets import load_boston boston = load_boston() boston.keys() import pandas as pd df = pd.DataFrame(boston.data) #将数据data转化为数据框 #1. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 ... 阅读全文
posted @ 2018-12-10 10:05 张龙坤 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-03 11:36 张龙坤 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: 高斯分布型 多项式型 伯努利型 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证。 3. 垃圾邮件分类 阅读全文
posted @ 2018-11-26 11:35 张龙坤 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 1.简述分类与聚类的联系与区别? 分类是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练得到,属于有指导学习范畴。聚类则没有事先预定的类别,类别数不确 阅读全文
posted @ 2018-11-19 11:39 张龙坤 阅读(297) 评论(0) 推荐(0) 编辑
摘要: #导包 from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import matplotlib.image as img import sys #1、读取图片 import matp... 阅读全文
posted @ 2018-11-12 11:35 张龙坤 阅读(125) 评论(0) 推荐(0) 编辑
摘要: import numpy as np x = np.random.randint(1, 100, [20, 1]) y = np.zeros(20) k = 3 # 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; def initcenter(x, k): return x[0:k].reshape(k) def nearest(kc, i): ... 阅读全文
posted @ 2018-11-07 18:58 张龙坤 阅读(144) 评论(0) 推荐(0) 编辑
摘要: #1. 安装scipy,numpy,sklearn包 import numpy as np #2. 从sklearn包自带的数据集中读出鸢尾花数据集data from sklearn.datasets import load_iris iris = load_iris() #3.查看data类型,包含哪些数据 print(type(iris)) #4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及... 阅读全文
posted @ 2018-11-06 11:39 张龙坤 阅读(149) 评论(0) 推荐(0) 编辑
摘要: #1. 安装scipy,numpy,sklearn包 from sklearn.datasets import load_iris #导入numpy import numpy #2. 从sklearn包自带的数据集中读出鸢尾花数据集data #3.查看data类型,包含哪些数据 data = load_iris() print(type(data)) print(data.keys()) ... 阅读全文
posted @ 2018-10-29 11:39 张龙坤 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12+b13,a22+b23,a32+b33,·····+an2+bn3 import numpy as np a = list(range(0,1000000)) b = l 阅读全文
posted @ 2018-10-22 11:27 张龙坤 阅读(115) 评论(0) 推荐(0) 编辑