摘要: predictionsAndLabels = predictions.zip(testData.map(lambda lp: lp.label)) 阅读全文
posted @ 2017-07-11 16:44 bonelee 阅读(2258) 评论(0) 推荐(0)
摘要: class pyspark.mllib.tree.RandomForest[source] Learning algorithm for a random forest model for classification or regression. New in version 1.2.0. New 阅读全文
posted @ 2017-07-11 14:48 bonelee 阅读(1628) 评论(0) 推荐(0)
摘要: Refer to the DecisionTree Python docs and DecisionTreeModel Python docs for more details on the API. from pyspark.mllib.tree import DecisionTree, Deci 阅读全文
posted @ 2017-07-11 14:47 bonelee 阅读(1473) 评论(0) 推荐(0)
摘要: 分类(Classification) 下面的例子说明了怎样导入LIBSVM 数据文件,解析成RDD[LabeledPoint],然后使用决策树进行分类。GINI不纯度作为不纯度衡量标准并且树的最大深度设置为5。最后计算了测试错误率从而评估算法的准确性。 以下代码展示了如何载入一个LIBSVM数据文件 阅读全文
posted @ 2017-07-11 11:43 bonelee 阅读(2989) 评论(0) 推荐(0)