会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
狮大大丶
博客园
首页
新随笔
联系
管理
订阅
2018年12月21日
期末大作业
摘要: 文本分类
阅读全文
posted @ 2018-12-21 13:47 狮大大丶
阅读(135)
评论(0)
推荐(0)
编辑
回归模型与房价预测
摘要: 1 #导入房价数据 2 from sklearn.datasets import load_boston 3 boston = load_boston() 4 boston.keys() 5 print(boston.DESCR) 6 data = boston.data #查看数据 7 boston.target #查看房价 8 boston.feature_names #特征 1 #一...
阅读全文
posted @ 2018-12-21 13:27 狮大大丶
阅读(185)
评论(0)
推荐(0)
编辑
2018年12月6日
朴素贝叶斯应用:垃圾邮件分类
摘要: 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测
阅读全文
posted @ 2018-12-06 21:40 狮大大丶
阅读(246)
评论(0)
推荐(0)
编辑
2018年11月22日
分类与监督学习,朴素贝叶斯分类算法
摘要: 一、简述分类与聚类的联系与区别 简述什么是监督学习与无监督学习 聚类:不知道答案的前提下,按照一定的相似性聚集元素。 分类:在有一定标准下,知道答案地进行元素分组。 监督学习:按照已知的条件,训练某种学习机器(即得到某种目标函数),使它能够对未知类别的样本进行分类。 无监督学习:实现的目标只是把相似
阅读全文
posted @ 2018-11-22 19:12 狮大大丶
阅读(158)
评论(0)
推荐(0)
编辑
2018年11月12日
聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用
摘要: import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcent(x,k): #初始聚类中心数组 return x[0:k].reshape(k) def nearest(kc,i): #数组中的值,与聚类中心最小距离所在类别的索引号 d=(abs(kc-...
阅读全文
posted @ 2018-11-12 11:39 狮大大丶
阅读(192)
评论(0)
推荐(0)
编辑
2018年11月5日
numpy数据集
摘要: #1. 安装scipy,numpy,sklearn包 from sklearn.datasets import load_iris #导入numpy import numpy #2. 从sklearn包自带的数据集中读出鸢尾花数据集data #3.查看data类型,包含哪些数据 data = load_iris() print(type(data)) print(data.keys()) ...
阅读全文
posted @ 2018-11-05 08:55 狮大大丶
阅读(489)
评论(0)
推荐(0)
编辑
2018年10月11日
组合数据类型,英文词频统计
摘要: 总结列表,元组,字典,集合的联系与区别 列表用[ ]创建,是可变的数据类型,可以被改变的,而且列表可以嵌套的。 元组用()创建,元素之间用“,”分隔,不能修改元组,是不可变的。 集合可以用set()函数或者{}创建,元素之间用“,”分隔,不可有重复元素;可以读写,是无序的。 字典由key和值valu
阅读全文
posted @ 2018-10-11 21:18 狮大大丶
阅读(126)
评论(0)
推荐(0)
编辑
2018年9月10日
python基础:条件循环字符串
摘要: 1.完成完整的温度转换程序 输入代码: 输出结果: 2.猜数字游戏(猜价格,猜年龄等) 输入代码: 输出结果: 3.解析身份证号、学号不同片段的含义 输入代码(身份证号): 输出结果(身份证号): 输入代码(学号): 输出结果(学号): 5、用for循环产生一系列网址 输入代码: 输出结果:
阅读全文
posted @ 2018-09-10 11:46 狮大大丶
阅读(340)
评论(0)
推荐(0)
编辑
公告