摘要: 一.简介 Spark的自定义udf和udaf是为了提供函数扩展,Spark本身提供了几十上百个算子,在数据分析的各个方面的常用计算方式都有提到,但计算场景千差万别,算子也不会面面俱到,如何在单机或集群上定义函数就是要重点关注的地方。特别是在集群模式中,函数需要使用spark注册才能在各个节点上使用, 阅读全文
posted @ 2018-11-26 17:56 云山之巅 阅读(789) 评论(0) 推荐(0)