摘要:
1. 执行器服务 ExecutorService java.util.concurrent.ExecutorService 接口表示一个异步执行机制,使我们能够在后台执行任务。因此一个 ExecutorService 很类似于一个线程池。实际上,存在于 java.util.concurrent 包里 阅读全文
posted @ 2019-01-17 18:29
吊车尾88
阅读(2015)
评论(0)
推荐(0)
摘要:
Catalog API简介 Spark中的DataSet和Dataframe API支持结构化分析。结构化分析的一个重要的方面是管理元数据。这些元数据可能是一些临时元数据(比如临时表)、SQLContext上注册的UDF以及持久化的元数据(比如Hivemeta store或者HCatalog)。 S 阅读全文
posted @ 2019-01-17 13:18
吊车尾88
阅读(2790)
评论(0)
推荐(0)
摘要:
UDAF简介 UDAF(User Defined Aggregate Function)即用户定义的聚合函数,聚合函数和普通函数的区别是什么呢,普通函数是接受一行输入产生一个输出,聚合函数是接受一组(一般是多行)输入然后产生一个输出,即将一组的值想办法聚合一下。 UDAF的误区 我们可能下意识的认为 阅读全文
posted @ 2019-01-17 10:15
吊车尾88
阅读(4999)
评论(0)
推荐(0)
摘要:
前言 本文介绍如何在Spark Sql和DataFrame中使用UDF,如何利用UDF给一个表或者一个DataFrame根据需求添加几列,并给出了旧版(Spark1.x)和新版(Spark2.x)完整的代码示例。 关于UDF:UDF:User Defined Function,用户自定义函数 创建测 阅读全文
posted @ 2019-01-17 09:53
吊车尾88
阅读(14110)
评论(0)
推荐(0)

浙公网安备 33010602011771号