06大数据-sparkstreaming - 随笔分类 - 四叶草Grass

SparkStream：4)foreachRDD详解

摘要：转载自：http://blog.csdn.net/jiangpeng59/article/details/53318761 foreachRDD通常用来把SparkStream运行得到的结果保存到外部系统比如HDFS、Mysql、Redis等等。了解下面的知识可以帮助我们避免很多误区误区1：实例化阅读全文

posted @ 2018-04-05 18:53 四叶草Grass 阅读(5040) 评论(0) 推荐(0)

通过Spark Streaming的foreachRDD把处理后的数据写入外部存储系统中

摘要：转载自：http://blog.csdn.net/erfucun/article/details/52312682 本博文主要内容包括：技术实现foreachRDD与foreachPartition解析 foreachRDD与foreachPartition实现实战一：技术实现foreach解析阅读全文

posted @ 2018-04-05 18:53 四叶草Grass 阅读(460) 评论(0) 推荐(0)

Spark Streaming 'numRecords must not be negative'问题解决

摘要：转载自：http://blog.csdn.net/xueba207/article/details/51135423 问题描述笔者使用spark streaming读取Kakfa中的数据，做进一步处理，用到了KafkaUtil的createDirectStream()方法；该方法不会自动保存top 阅读全文

posted @ 2018-01-30 11:33 四叶草Grass 阅读(1161) 评论(0) 推荐(0)

spark-streaming-kafka-0-8 和 0-10的使用区别

摘要：一、spark-streaming-kafka-0-8_2.11-2.0.2.jar 1、pom.xml  <dependency> <groupI 阅读全文

posted @ 2017-09-11 15:38 四叶草Grass 阅读(2582) 评论(0) 推荐(0)

使用spark streaming报错ERROR DFSClient: Failed to close inode xxxx

摘要：转载自：http://blog.csdn.net/xiaolixiaoyi/article/details/45875101 好几个Spark streaming的程序同时运行，发现spark报出了如下错误： ERROR DFSClient: Failed to close inode 23828 阅读全文

posted @ 2017-08-07 20:08 四叶草Grass 阅读(1574) 评论(0) 推荐(0)

SparkStreaming整合kafka编程

摘要：1、下载spark-streaming-kafka插件包由于Linux集群环境我使用spark是spark-2.1.1-bin-hadoop2.7，kafka是kafka_2.11-0.8.2.1，所以我下载的是spark-streaming-kafka-0-8_2.11-2.1.1.jar。官阅读全文

posted @ 2017-07-31 12:07 四叶草Grass 阅读(1064) 评论(0) 推荐(0)

基于Java+SparkStreaming整合kafka编程

摘要：一、下载依赖jar包具体可以参考：SparkStreaming整合kafka编程二、创建Java工程太简单，略。三、实际例子 spark的安装包里面有好多例子，具体路径：spark-2.1.1-bin-hadoop2.7\examples。 JavaDirectKafkaWordCount. 阅读全文

posted @ 2017-07-31 11:57 四叶草Grass 阅读(1205) 评论(0) 推荐(0)

随笔分类 - 06大数据-sparkstreaming

公告