摘要: 文本分类 阅读全文
posted @ 2018-12-21 13:47 狮大大丶 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 1 #导入房价数据 2 from sklearn.datasets import load_boston 3 boston = load_boston() 4 boston.keys() 5 print(boston.DESCR) 6 data = boston.data #查看数据 7 boston.target #查看房价 8 boston.feature_names #特征 1 #一... 阅读全文
posted @ 2018-12-21 13:27 狮大大丶 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-06 21:40 狮大大丶 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 一、简述分类与聚类的联系与区别 简述什么是监督学习与无监督学习 聚类:不知道答案的前提下,按照一定的相似性聚集元素。 分类:在有一定标准下,知道答案地进行元素分组。 监督学习:按照已知的条件,训练某种学习机器(即得到某种目标函数),使它能够对未知类别的样本进行分类。 无监督学习:实现的目标只是把相似 阅读全文
posted @ 2018-11-22 19:12 狮大大丶 阅读(158) 评论(0) 推荐(0) 编辑
摘要: import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcent(x,k): #初始聚类中心数组 return x[0:k].reshape(k) def nearest(kc,i): #数组中的值,与聚类中心最小距离所在类别的索引号 d=(abs(kc-... 阅读全文
posted @ 2018-11-12 11:39 狮大大丶 阅读(192) 评论(0) 推荐(0) 编辑
摘要: #1. 安装scipy,numpy,sklearn包 from sklearn.datasets import load_iris #导入numpy import numpy #2. 从sklearn包自带的数据集中读出鸢尾花数据集data #3.查看data类型,包含哪些数据 data = load_iris() print(type(data)) print(data.keys()) ... 阅读全文
posted @ 2018-11-05 08:55 狮大大丶 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 总结列表,元组,字典,集合的联系与区别 列表用[ ]创建,是可变的数据类型,可以被改变的,而且列表可以嵌套的。 元组用()创建,元素之间用“,”分隔,不能修改元组,是不可变的。 集合可以用set()函数或者{}创建,元素之间用“,”分隔,不可有重复元素;可以读写,是无序的。 字典由key和值valu 阅读全文
posted @ 2018-10-11 21:18 狮大大丶 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 1.完成完整的温度转换程序 输入代码: 输出结果: 2.猜数字游戏(猜价格,猜年龄等) 输入代码: 输出结果: 3.解析身份证号、学号不同片段的含义 输入代码(身份证号): 输出结果(身份证号): 输入代码(学号): 输出结果(学号): 5、用for循环产生一系列网址 输入代码: 输出结果: 阅读全文
posted @ 2018-09-10 11:46 狮大大丶 阅读(340) 评论(0) 推荐(0) 编辑