1.28
第8天:Spark Streaming基础
学习目标:理解Spark Streaming原理,掌握DStream编程。
具体内容:
流处理概念,Spark Streaming架构。
DStream的创建(从Socket、Kafka等),转换操作(map、reduceByKey、window)。
输出操作(print、saveAsTextFiles)。
练习:使用Spark Streaming监听本地端口,实时统计单词数量。
任务:
编写一个Spark Streaming程序,从Socket源读取数据,每10秒统计一次单词出现次数。

浙公网安备 33010602011771号