2016年1月5日

摘要: 1、前言: Naive Bayes(朴素贝叶斯)是一个简单的多类分类算法,该算法的前提是假设各特征之间是相互独立的。Naive Bayes 训练主要是为每一个特征,在给定的标签的条件下,计算每个特征在该标签的条件下的条件概率。最后用这个训练后的条件概率去预测。 由于我使用的Spark的版本是1.... 阅读全文
posted @ 2016-01-05 14:52 ljy2013 阅读(1288) 评论(0) 推荐(0) 编辑
 
摘要: MLlib 支持存放在单机上的本地向量和矩阵,也支持通过多个RDD实现的分布式矩阵。因此MLlib的数据类型主要分为两大类:一个是本地单机向量;另一个是分布式矩阵。下面分别介绍一下这两大类都有哪些类型: 1、Local vector(本地向量) (1)Vector 最基本的类型是Vector,该类型 阅读全文
posted @ 2016-01-05 09:56 ljy2013 阅读(856) 评论(0) 推荐(0) 编辑