智能先行者

2017年5月2日

摘要： import org.apache.spark.sql.SparkSession import org.apache.spark.sql.functions._ object Test2 { def main(args: Array[String]): Unit = { val spark = SparkSession .builder() .appName... 阅读全文

posted @ 2017-05-02 20:51 智能先行者阅读(3466) 评论(0) 推荐(0)

2017年4月30日

R和Tableau平行坐标图

摘要： R平行坐标图 library(lattice)data(iris)parallelplot( ~ iris[1:4], iris, groups = Species, horizontal.axis = FALSE, scales = list(x = list(rot = 90))) Tablea 阅读全文

posted @ 2017-04-30 18:33 智能先行者阅读(2817) 评论(1) 推荐(0)

2017年1月11日

Scala断言

摘要：断言：提供了一组断言函数以用作在代码中记录和动态检查不变量的方式。阅读全文

posted @ 2017-01-11 16:59 智能先行者阅读(1200) 评论(0) 推荐(0)

2017年1月4日

Spark Gradient-boosted trees (GBTs)梯度提升树

摘要：梯度提升树（GBT）是决策树的集合。 GBT迭代地训练决策树以便使损失函数最小化。 spark.ml实现支持GBT用于二进制分类和回归，可以使用连续和分类特征。导入包导入数据源 GBT建模代码执行结果阅读全文

posted @ 2017-01-04 13:17 智能先行者阅读(2761) 评论(0) 推荐(0)

2016年12月27日

Spark Multilayer perceptron classifier (MLPC)多层感知器分类器

摘要：多层感知器分类器（MLPC）是基于前馈人工神经网络(ANN)的分类器。 MLPC由多个节点层组成。每个层完全连接到网络中的下一层。输入层中的节点表示输入数据。所有其他节点,通过输入与节点的权重w和偏置b的线性组合,并应用激活函数,将输入映射到输出。对于具有K + 1层的MLPC，这可以以矩阵阅读全文

posted @ 2016-12-27 15:21 智能先行者阅读(6107) 评论(1) 推荐(0)

Spark LogisticRegression 逻辑回归之建模

摘要：导入包导入源数据逻辑回归建模代码执行结果阅读全文

posted @ 2016-12-27 09:23 智能先行者阅读(11660) 评论(6) 推荐(2)

2016年12月26日

Spark2 Random Forests 随机森林

摘要：随机森林是决策树的集合。随机森林结合许多决策树，以减少过度拟合的风险。 spark.ml实现支持随机森林，使用连续和分类特征，做二分类和多分类以及回归。导入包导入源数据随机森林建模代码执行结果随机森林模型调优阅读全文

posted @ 2016-12-26 15:02 智能先行者阅读(2110) 评论(0) 推荐(0)

2016年12月23日

Spark LogisticRegression 逻辑回归之简介

摘要： LogisticRegression简介阅读全文

posted @ 2016-12-23 15:20 智能先行者阅读(948) 评论(1) 推荐(0)

2016年12月22日

Spark Pipeline

摘要：一个简单的Pipeline，用作estimator。Pipeline由有序列的stages组成，每个stage是一个Estimator或者一个Transformer。当Pipeline调用fit，stages按顺序被执行。如果一个stage是一个Estimator，将调用Estimator的fit 阅读全文

posted @ 2016-12-22 21:37 智能先行者阅读(1709) 评论(0) 推荐(1)

Spark2 Model selection and tuning 模型选择与调优

摘要： Model selection模型选择 ML中的一个重要任务是模型选择，或使用数据为给定任务找到最佳的模型或参数。这也称为调优。可以对诸如Logistic回归的单独Estimators进行调整，或者对包括多个算法，特征和其他步骤的整个Pipeline进行调整。用户可以一次调整整个Pipelin 阅读全文

posted @ 2016-12-22 10:39 智能先行者阅读(778) 评论(0) 推荐(0)

公告