partition
摘要:
机器学习一般算法的输入是训练集和测试集,通常来说是(label, key : value)这样的序对。对于这种输入,直接使用SparkContext提供的textFile()接口就好了,MLlib内部会转换成LabeledPoint类。分布式数据并行环境下,保持数据的本地性是非常重要的内容,事关分布... 阅读全文
posted @ 2015-06-05 15:54
小瓶盖xpg
阅读(163)
评论(0)
推荐(0)
浙公网安备 33010602011771号