摘要: 来自官网DataFrames、DataSets、SQL,即sparkSQL模块。 通过dataframe接口,sparkSQL支持多种数据源的操作。可以把dataframe注册为临时视图,也可以通过关系转换。 1)默认格式是parquet,这是一种columnar(柱状的,按列的)的格式,按列存储( 阅读全文
posted @ 2017-10-11 17:54 小熊_看看 阅读(233) 评论(0) 推荐(0) 编辑