Structured Streaming——声明式流处理API 内容要点:
从DStream(RDD范式)到Structured Streaming(DataFrame范式)的演进。
核心模型:将数据流视为“无界表”,每个新数据像追加到表中的行。
输出模式:Append(仅追加)、Complete(完整结果)、Update(更新结果)。
入门案例:使用readStream读取文件流,执行groupBy聚合,使用writeStream输出到控制台。