Fork me on GitHub

05 2020 档案

摘要:一、概述 (一)什么是Spark Streaming Spark Streaming是Spark核心API的扩展,它支持实时数据的可伸展的、高吞吐量的、容错的流处理;数据可以从很多的数据源来获取,比如,Kafka, Flume, Kinesis, 或者TCP sockets,并且这些数据可以使用像m 阅读全文
posted @ 2020-05-03 15:32 iveBoy 阅读(120) 评论(0) 推荐(0)
摘要:一、Spark SQL概述 Spark SQL是Apache Spark的一个模块,用于处理结构化数据,包括以下几方面: 1、SQL查询与Spark程序进行混合 Spark SQL允许你使用使用SQL或者DataFrame的API在Spark程序中进行结构化数据查询,你可以使用Java、Python 阅读全文
posted @ 2020-05-02 16:39 iveBoy 阅读(132) 评论(0) 推荐(0)

TOP