会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
何威1702
博客园
首页
新随笔
联系
订阅
管理
1
2
3
下一页
2020年6月23日
大数据应用技术课程实践--选题与实践方案
摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 选题:2.Kaggle分析数据项目 泰坦尼克号生还预测 Kaggle公司是由联合创始人兼首席执行官AnthonyGoldbloom2010年在墨尔本创立的,主要是为开发商和数据科学家提供举办机器学习竞赛、托
阅读全文
posted @ 2020-06-23 16:05 何威1702
阅读(251)
评论(0)
推荐(0)
2020年6月14日
13-垃圾邮件分类2
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target,
阅读全文
posted @ 2020-06-14 21:00 何威1702
阅读(127)
评论(0)
推荐(0)
12.朴素贝叶斯-垃圾邮件分类
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl
阅读全文
posted @ 2020-06-14 20:59 何威1702
阅读(96)
评论(0)
推荐(0)
8、特征选择
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的
阅读全文
posted @ 2020-06-14 20:58 何威1702
阅读(62)
评论(0)
推荐(0)
2020年6月11日
15 手写数字识别-小数据集
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分
阅读全文
posted @ 2020-06-11 10:25 何威1702
阅读(116)
评论(0)
推荐(0)
2020年5月13日
11.分类与监督学习,朴素贝叶斯分类算法
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2020-05-13 20:53 何威1702
阅读(1)
评论(0)
推荐(0)
2020年5月4日
9、主成分分析
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2020-05-04 19:31 何威1702
阅读(0)
评论(0)
推荐(0)
2020年4月29日
7.逻辑回归实践
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2020-04-29 21:36 何威1702
阅读(3)
评论(0)
推荐(0)
2020年4月25日
6.逻辑回归
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2020-04-25 21:32 何威1702
阅读(4)
评论(0)
推荐(0)
2020年4月22日
5.线性回归算法
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2020-04-22 19:45 何威1702
阅读(5)
评论(0)
推荐(0)
1
2
3
下一页
公告