代码改变世界

大数据应用技术课程实践--选题与实践方案

2020-06-23 17:34 by 当地一个比较帅的人, 193 阅读, 0 推荐, 收藏, 编辑
摘要:一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 Kaggle分析数据项目:kaggle泰坦尼克之灾 https://www.kaggle.com/c/titanic 首先是自己电脑配置的硬件问题,再之后是因为对这个比较感兴趣,而且这个项目可以参赛获奖, 阅读全文

15 手写数字识别

2020-06-14 20:46 by 当地一个比较帅的人, 123 阅读, 0 推荐, 收藏, 编辑
摘要:补缴作业: 2.机器学习相关数学基础 https://www.cnblogs.com/SZZZ/p/13126836.html 4.K均值算法--应用 https://www.cnblogs.com/SZZZ/p/13126782.html 5.线性回归算法 https://www.cnblogs. 阅读全文

2.机器学习相关数学基础

2020-06-14 20:39 by 当地一个比较帅的人, 136 阅读, 0 推荐, 收藏, 编辑
摘要:1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 概率公式: 二项分布 两点分布: 2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”,可以word编辑,可做思维导图,可以手写拍照,要求言简意赅、排版整洁。 梯度:梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取 阅读全文

4.K均值算法--应用

2020-06-14 20:29 by 当地一个比较帅的人, 154 阅读, 0 推荐, 收藏, 编辑
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 import matplo 阅读全文

5.线性回归算法

2020-06-14 20:18 by 当地一个比较帅的人, 102 阅读, 0 推荐, 收藏, 编辑
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归:就是能够用一个直线较为精确地描述数据之间的关系。这样当出现新的数据的时候,就能够预测出一个简单的值,常用的拟合法为最小二乘法。线性回归可以对大量的观测数据进行处理,从而得到比较符合事物内部规律的数学表达式。 2. 阅读全文

8、特征选择

2020-06-14 20:11 by 当地一个比较帅的人, 110 阅读, 0 推荐, 收藏, 编辑
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文

13-垃圾邮件分类2

2020-06-14 20:07 by 当地一个比较帅的人, 160 阅读, 0 推荐, 收藏, 编辑
摘要:1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文

12.朴素贝叶斯-垃圾邮件分类

2020-06-14 19:47 by 当地一个比较帅的人, 109 阅读, 0 推荐, 收藏, 编辑
摘要:1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文

14.深度学习-卷积

2020-06-07 18:49 by 当地一个比较帅的人, 232 阅读, 0 推荐, 收藏, 编辑
摘要:15 手写数字识别及其补交作业 https://www.cnblogs.com/SZZZ/p/13126584.html 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动 阅读全文

11.分类与监督学习,朴素贝叶斯分类算法

2020-05-07 22:23 by 当地一个比较帅的人, 233 阅读, 0 推荐, 收藏, 编辑
摘要:1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类就是按照数据的属性给对象贴上标签,再根据标签来分类,属于无监督学习,聚类就是指事先定义好类别,然后通过某种度量(比如距离)将他们分类。 简述什么是监督学习与无监督学习。 监督学习 利用一组已知类别的样本调整分类器的参数,使 阅读全文