随笔分类 - spark操作
摘要:aggregateByKey 函数原型:aggregateByKey(zeroValue, seqFunc, combFunc, numPartitions=None) 参数与aggregate相同 根据key进行合并 上例稍加改动可以完成一个wordcounts 参数与aggregate相同 根据
阅读全文
摘要:CoordinateMatrix坐标矩阵
阅读全文
摘要:Spark SQL中的DataFrame类似于一张关系型数据表。在关系型数据库中对单表或进行的查询操作,在DataFrame中都可以通过调用其API接口来实现。可以参考,Scala提供的DataFrame API。 本文中的代码基于Spark-1.6.2的文档实现。 一、DataFrame对象的生成
阅读全文

浙公网安备 33010602011771号