摘要: streaming 应用程序必须 24/7 运行, 因此必须对应用逻辑无关的故障(例如, 系统故障, JVM 崩溃等)具有弹性. 为了可以这样做, Spark Streaming 需要 checkpoint 足够的信息到容错存储系统, 以便可以从故障中恢复.checkpoint 有两种类型的数据. 阅读全文
posted @ 2017-11-07 16:56 gyhuminyan 阅读(207) 评论(0) 推荐(0)
摘要: 在集群上的 Spark Streaming application 中获得最佳性能需要一些调整.本节介绍了可调整的多个 parameters (参数)和 configurations (配置)提高你的应用程序性能.在高层次上, 你需要考虑两件事情: 通过有效利用集群资源, Reducing the 阅读全文
posted @ 2017-11-07 15:56 gyhuminyan 阅读(796) 评论(0) 推荐(0)
摘要: 调整 Spark 应用程序的内存使用情况和 GC behavior 已经有很多的讨论在 Tuning Guide 中.我们强烈建议您阅读一下.在本节中, 我们将在 Spark Streaming applications 的上下文中讨论一些 tuning parameters (调优参数). Spa 阅读全文
posted @ 2017-11-07 15:33 gyhuminyan 阅读(452) 评论(0) 推荐(0)
摘要: 简介 Kafka 0.10的Spark Streaming集成设计与0.8 Direct Stream方法类似。 它提供了简单的并行性,Kafka分区和Spark分区之间的1:1对应关系,以及对偏移量和元数据的访问。 但是,由于较新的集成使用新的Kafka消费者API而不是简单的API,所以在使用上 阅读全文
posted @ 2017-11-07 15:25 gyhuminyan 阅读(1956) 评论(3) 推荐(1)
摘要: (1)在pom.xml中加入如下依赖包 (2)在MySql中创建数据库和表,命令操作如下 (3)使用Java编写一个数据库连接池类 (5)打开netcat发送数据 (6)提交 阅读全文
posted @ 2017-11-07 14:24 gyhuminyan 阅读(7361) 评论(0) 推荐(0)