摘要:
```scala sparkConf.set("spark.streaming.stopGracefullyOnShutdown", "true") // 启动新的线程,希望在特殊的场合关闭SparkStreaming new Thread(new Runnable { override def run(): Unit = { while ( true ) { try { Thread.sleep 阅读全文
posted @ 2019-11-15 20:07
qingfeng68
阅读(174)
评论(0)
推荐(0)
摘要:
第一章:Spark概述 1.1 什么是Spark 是一种基于内存的快速、通用、可扩展的大数据分析引擎。 1.2 Spark内置模块 Spark Core: 实现了Spark的基本功能,包含 任务调度、 内存管理、 错误恢复、 存储系统交互等模块。 Spark Core中还包含了对弹性分布式数据集(R 阅读全文
posted @ 2019-11-15 20:06
qingfeng68
阅读(239)
评论(0)
推荐(0)
摘要:
第1章 RDD概述 1.1 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式 数据集 ,是Spark中最基本的数据(计算)抽象。代码中是一个抽象类,它代表一个不可变、可分区、里面的元素可并行计算的集合。 1.2 RDD的属性 1. 一组分区(Parti 阅读全文
posted @ 2019-11-15 20:06
qingfeng68
阅读(234)
评论(0)
推荐(0)
摘要:
``` log4j.rootLogger=INFO,CONSOLE log4j.addivity.org.apache=true # console log4j.appender.CONSOLE=org.apache.log4j.ConsoleAppender log4j.appender.CONSOLE.Threshold=INFO log4j.appender.CONSOLE.Target=S 阅读全文
posted @ 2019-11-15 19:57
qingfeng68
阅读(139)
评论(0)
推荐(0)
该文被密码保护。 阅读全文
posted @ 2019-11-15 19:55
qingfeng68
阅读(11)
评论(0)
推荐(0)

浙公网安备 33010602011771号