随笔分类 - spark
摘要:SparkSQL 数据分析的方式 数据分析的方式大致上可以划分为 SQL 和 命令式两种 命令式在前面的 RDD 部分, 非常明显可以感觉的到是命令式的, 主要特征是通过一个算子, 可以得到一个结果, 通过结果再进行后续计算sc.textFile("...").flatMap(_.split(" "
阅读全文
摘要:spark-初阶①(介绍+RDD) Spark是什么? Apache Spark 是一个快速的, 多用途的集群计算系统, 相对于 Hadoop MapReduce 将中间结果保存在磁盘中, Spark 使用了内存保存中间结果, 能在数据尚未写入硬盘时在内存中进行运算. Spark的特点(优点) 速度
阅读全文

浙公网安备 33010602011771号