摘要:
Spark SQL UDF和UDAF/** * scala代码 */package com.tom.spark.sqlimport org.apache.spark.sql.expressions.{MutableAggregationBuffer, UserDefinedAggregateFu... 阅读全文
posted @ 2017-10-18 17:47
柚子=_=
阅读(176)
评论(0)
推荐(0)
摘要:
一、Spark SQL下的Parquet使用最佳实践1)过去整个业界对大数据的分析的技术栈的Pipeline一般分为以下两种方式:a)Data Source -> HDFS -> MR/Hive/Spark(相当于ETL)-> HDFS Parquet -> Spark SQL/Impala -> ... 阅读全文
posted @ 2017-10-18 15:09
柚子=_=
阅读(1095)
评论(0)
推荐(0)

浙公网安备 33010602011771号