Python 基础强化

知识点:
核心数据结构:列表、元组、字典、集合(适配 RDD 元素操作)
高阶函数:lambda、map、filter、reduce(Spark RDD 算子的 Python 基础)
迭代器与生成器:减少内存占用,适配大数据处理场景
练习:
用 Python 原生高阶函数实现词频统计,对比 Spark RDD 算子逻辑
编写生成器函数,模拟大数据流的逐行读取
易错:
lambda表达式仅支持单行逻辑,复杂逻辑需定义普通函数
Spark 的map、filter算子与 Python 原生高阶函数逻辑完全一致

posted @ 2026-01-18 00:28  再报错就堵桥0  阅读(3)  评论(0)    收藏  举报