2019 年 8月 2 日随笔档案 - 米兰的小铁將

2019年8月2日

摘要：一、Hive数据源案例1、概述Spark SQL支持对Hive中存储的数据进行读写。操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。HiveContext继承自SQLContext，但是增加了在Hive元数据库中查找表，以及用HiveQL语法编写SQL的功能。除了sql()方法，HiveContext还提供了hql()方法，从而用Hive语法来编译sql。使用H... 阅读全文

posted @ 2019-08-02 13:23 米兰的小铁將阅读(621) 评论(0) 推荐(0)

40、JSON数据源综合案例实战

摘要：一、JSON数据源综合案例实战1、概述Spark SQL可以自动推断JSON文件的元数据，并且加载其数据，创建一个DataFrame。可以使用SQLContext.read.json()方法，针对一个元素类型为String的RDD，或者是一个JSON文件。但是要注意的是，这里使用的JSON文件与传统意义上的JSON文件是不一样的。每行都必须，也只能包含一个，单独的，自包含的，有效的JSON对象。不... 阅读全文

posted @ 2019-08-02 09:55 米兰的小铁將阅读(398) 评论(0) 推荐(0)

米兰的小铁將

公告