摘要: 第15章 大数据与MapReduce 大数据 概述 大数据: 收集到的数据已经远远超出了我们的处理能力。 大数据 场景 MapRedece Hadoop 概述 MapRedece 原理 MapRedece 工作原理 主节点控制 MapReduce 的作业流程 MapReduce 的作业可以分成map 阅读全文
posted @ 2017-11-13 14:43 片刻 阅读(679) 评论(0) 推荐(1) 编辑
摘要: 第14章 利用SVD简化数据 SVD 概述 SVD 场景 信息检索-隐形语义检索(Lstent Semantic Indexing, LSI)或 隐形语义分析(Latent Semantic Analysis, LSA) 隐性语义索引:矩阵 = 文档 + 词语 是最早的 SVD 应用之一,我们称利用 阅读全文
posted @ 2017-11-10 16:25 片刻 阅读(1258) 评论(1) 推荐(1) 编辑
摘要: 第13章 利用 PCA 来简化数据 降维技术 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球。 显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。 人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给出运动场上球的位置。 在这个过程中,人们已经 阅读全文
posted @ 2017-11-09 13:07 片刻 阅读(1453) 评论(0) 推荐(0) 编辑
摘要: 第12章 使用FP-growth算法来高效发现频繁项集 前言 在 第11章 时我们已经介绍了用 Apriori 算法发现 频繁项集 与 关联规则。本章将继续关注发现 频繁项集 这一任务,并使用 FP-growth 算法更有效的挖掘 频繁项集。 FP-growth 算法简介 一种非常好的发现频繁项集算 阅读全文
posted @ 2017-11-03 16:26 片刻 阅读(921) 评论(1) 推荐(2) 编辑
摘要: 第11章 使用 Apriori 算法进行关联分析 关联分析 关联分析是一种在大规模数据集中寻找有趣关系的任务。 这些关系可以有两种形式: 频繁项集(frequent item sets): 经常出现在一块的物品的集合。 关联规则(associational rules): 暗示两种物品之间可能存在很 阅读全文
posted @ 2017-11-01 14:07 片刻 阅读(859) 评论(1) 推荐(4) 编辑
摘要: 第 10 章 K-Means(K-均值)聚类算法 K-Means 算法 聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.相似这一概念取决于所选择的相似度计算方法.K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 阅读全文
posted @ 2017-10-30 14:23 片刻 阅读(766) 评论(0) 推荐(0) 编辑
摘要: 第9章 树回归 树回归 概述 我们本章介绍 CART(Classification And Regression Trees, 分类回归树) 的树构建算法。该算法既可以用于分类还可以用于回归。 树回归 场景 我们在第 8 章中介绍了线性回归的一些强大的方法,但这些方法创建的模型需要拟合所有的样本点( 阅读全文
posted @ 2017-10-27 16:15 片刻 阅读(927) 评论(0) 推荐(1) 编辑
摘要: 第8章 预测数值型数据:回归 回归(Regression) 概述 我们前边提到的分类的目标变量是标称型数据,而回归则是对连续型的数据做出处理,回归的目的是预测数值型数据的目标值。 回归 场景 回归的目的是预测数值型的目标值。最直接的办法是依据输入写出一个目标值的计算公式。 假如你想要预测兰博基尼跑车 阅读全文
posted @ 2017-10-26 11:56 片刻 阅读(1237) 评论(0) 推荐(0) 编辑
摘要: 第7章 集成方法 ensemble method 集成方法: ensemble method(元算法: meta algorithm) 概述 概念:是对其他算法进行组合的一种形式。 通俗来说: 当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。 机器学习处理问题时又何尝不是如此? 这 阅读全文
posted @ 2017-10-20 10:45 片刻 阅读(2739) 评论(6) 推荐(0) 编辑
摘要: 第6章 支持向量机 如果公式不现实,请使用MarkDown的编辑器,加载 js 就可以看见了 <script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></ 阅读全文
posted @ 2017-10-19 00:44 片刻 阅读(1331) 评论(5) 推荐(0) 编辑