随笔分类 -  Spark

摘要:Spark_常用算子 sortBy-sortBy: 指定一个字段进行排序,默认是升序, ascending = false: 降序 package com.core.day2 import org.apache.spark.rdd.RDD import org.apache.spark.{Spark 阅读全文
posted @ 2022-07-12 22:28 a-tao必须奥利给 阅读(63) 评论(0) 推荐(0)
摘要:Spark解决问题 配置pom.xml文件 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLS 阅读全文
posted @ 2022-07-12 13:59 a-tao必须奥利给 阅读(40) 评论(0) 推荐(0)
摘要:spark-算子 groupBy -分组 package com.core import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object Demo7GroupBy { def main 阅读全文
posted @ 2022-07-12 08:49 a-tao必须奥利给 阅读(51) 评论(0) 推荐(0)
摘要:Spark内核 RDD ResilientDistributedDataset (弹性分布式数据集 ) 五大特性: A list of partitions A function for computing each split A list of dependencies on other RDD 阅读全文
posted @ 2022-07-12 08:39 a-tao必须奥利给 阅读(277) 评论(0) 推荐(0)
摘要:Spark初识 回顾一下前面的MapReduce流程,可以更好的学习spark spark的框架 spark为什么比hadoop速度快 spark支持哪些语言 spark的运行模式有哪些 spark的单词统计 package com.core import org.apache.spark.rdd. 阅读全文
posted @ 2022-07-12 08:19 a-tao必须奥利给 阅读(47) 评论(0) 推荐(0)