Fork me on GitHub
摘要: 一、UDF介绍 UDF(User Define Function),即用户自定义函数,Spark的官方文档中没有对UDF做过多介绍,猜想可能是认为比较简单吧。 几乎所有sql数据库的实现都为用户提供了扩展接口来增强sql语句的处理能力,这些扩展称之为UDXXX,即用户定义(User Define)的XXX,这个XXX可以是对单行操作的UDF,或者是对多行操作的UDAF,或者是UDTF,本次主要... 阅读全文
posted @ 2018-08-12 18:37 CC11001100 阅读(12903) 评论(0) 推荐(1) 编辑
摘要: 一、什么是Catalog Spark SQL提供了执行sql语句的支持,sql语句是以表的方式组织使用数据的,而表本身是如何组织存储的呢,肯定是存在一些元数据之类的东西了,Catalog就是Spark 2.0之后提供的访问元数据的类: Catalog提供一些API用来对数据库、表、视图、缓存、列、函数(UDF/UDAF)进行操作,下文将一一介绍。 二、如何使用Catalog 得到Cat... 阅读全文
posted @ 2018-08-12 17:03 CC11001100 阅读(4695) 评论(0) 推荐(0) 编辑