摘要: 一.SparkStreaming简介 SparkStreaming是核心Spark API的扩展,可以实现实时【准实时】数据流的可伸缩、高吞吐及容错处理。数据可以从像Kafka、Flume、HDFS/S3、Twitter或TCP套接字等许多来源获取。并且可以使用高级的算子例如,map,reduce, 阅读全文
posted @ 2019-04-08 20:46 云山之巅 阅读(714) 评论(0) 推荐(0)