随笔分类 -  SparkSQL学习总结

Spark SQL,作为Apache Spark大数据框架的一部分,主要用于结构化数据处理和对Spark数据执行类SQL的查询。通过Spark SQL,可以针对不同格式的数据执行ETL操作(如JSON,Parquet,数据库)然后完成特定的查询操作。
摘要:1、数据样本:data1.txt xiaoming,25,chengduxiaohua,23,beijingliuyang,16,hangzhouxiaoqiang,19,zhejiang 2、demo例子 3、输出结果 name:liuyang age:16 addr:hangzhouname:x 阅读全文
posted @ 2017-12-26 18:46 麻雀虽小五脏俱全 阅读(1825) 评论(0) 推荐(0)