狮大大丶

2018年12月21日

摘要：文本分类阅读全文

posted @ 2018-12-21 13:47 狮大大丶阅读(144) 评论(0) 推荐(0)

摘要： 1 #导入房价数据 2 from sklearn.datasets import load_boston 3 boston = load_boston() 4 boston.keys() 5 print(boston.DESCR) 6 data = boston.data #查看数据 7 boston.target #查看房价 8 boston.feature_names #特征 1 #一... 阅读全文

posted @ 2018-12-21 13:27 狮大大丶阅读(198) 评论(0) 推荐(0)

2018年12月6日

朴素贝叶斯应用：垃圾邮件分类

摘要： 1. 数据准备：收集数据与读取 2. 数据预处理：处理数据 3. 训练集与测试集：将先验数据按一定比例进行拆分。 4. 提取数据特征，将文本解析为词向量。 5. 训练模型：建立模型，用训练数据训练模型。即根据训练样本集，计算词项出现的概率P(xi|y)，后得到各类下词汇出现概率的向量。 6. 测阅读全文

posted @ 2018-12-06 21:40 狮大大丶阅读(257) 评论(0) 推荐(0)

2018年11月22日

分类与监督学习，朴素贝叶斯分类算法

摘要：一、简述分类与聚类的联系与区别简述什么是监督学习与无监督学习聚类：不知道答案的前提下，按照一定的相似性聚集元素。分类：在有一定标准下，知道答案地进行元素分组。监督学习：按照已知的条件，训练某种学习机器（即得到某种目标函数），使它能够对未知类别的样本进行分类。无监督学习：实现的目标只是把相似阅读全文

posted @ 2018-11-22 19:12 狮大大丶阅读(169) 评论(0) 推荐(0)

2018年11月12日

聚类--K均值算法：自主实现与sklearn.cluster.KMeans调用

摘要： import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcent(x,k): #初始聚类中心数组 return x[0:k].reshape(k) def nearest(kc,i): #数组中的值，与聚类中心最小距离所在类别的索引号 d=(abs(kc-... 阅读全文

posted @ 2018-11-12 11:39 狮大大丶阅读(204) 评论(0) 推荐(0)

2018年11月5日

numpy数据集

摘要： #1. 安装scipy，numpy，sklearn包 from sklearn.datasets import load_iris #导入numpy import numpy #2. 从sklearn包自带的数据集中读出鸢尾花数据集data #3.查看data类型，包含哪些数据 data = load_iris() print(type(data)) print(data.keys()) ... 阅读全文

posted @ 2018-11-05 08:55 狮大大丶阅读(501) 评论(0) 推荐(0)

2018年10月11日

组合数据类型，英文词频统计

摘要：总结列表，元组，字典，集合的联系与区别列表用[ ]创建，是可变的数据类型，可以被改变的，而且列表可以嵌套的。元组用()创建，元素之间用“,”分隔，不能修改元组，是不可变的。集合可以用set()函数或者{}创建，元素之间用“,”分隔，不可有重复元素；可以读写，是无序的。字典由key和值valu 阅读全文

posted @ 2018-10-11 21:18 狮大大丶阅读(140) 评论(0) 推荐(0)

2018年9月10日

python基础：条件循环字符串

摘要： 1.完成完整的温度转换程序输入代码：输出结果： 2.猜数字游戏（猜价格，猜年龄等）输入代码：输出结果： 3.解析身份证号、学号不同片段的含义输入代码（身份证号）：输出结果（身份证号）：输入代码（学号）：输出结果（学号）： 5、用for循环产生一系列网址输入代码：输出结果：阅读全文

posted @ 2018-09-10 11:46 狮大大丶阅读(350) 评论(0) 推荐(0)

公告