摘要: 1、集群管理 前台启动broker bin/kafka-server-start.sh <path>/server.properties Ctrl + C 关闭 后台启动broker bin/kafka-server-start.sh -daemon <path>/server.properties 阅读全文
posted @ 2019-09-16 09:27 独孤风 阅读(2170) 评论(0) 推荐(2) 编辑
摘要: 1.背景 Apache Flink 和 Apache Storm 是当前业界广泛使用的两个分布式实时计算框架。其中 Apache Storm(以下简称“Storm”)在美团点评实时计算业务中已有较为成熟的运用(可参考 Storm 的 可靠性保证测试),有管理平台、常用 API 和相应的文档,大量实时 阅读全文
posted @ 2019-09-12 09:47 独孤风 阅读(12663) 评论(0) 推荐(2) 编辑
摘要: 本文简述通过maven和gradle快速构建的Flink工程。建议安装好Flink以后构建自己的Flink项目,安装与示例运行请查看:Flink快速入门--安装与示例运行. 在安装好Flink以后,只要快速构建Flink工程,并完成相关代码开发,就可以轻松入手Flink。 构建工具 Flink项目可 阅读全文
posted @ 2019-09-10 10:24 独孤风 阅读(2552) 评论(0) 推荐(2) 编辑
摘要: 1、了解 Apache Kafka 1.1、简介 官网:http://kafka.apache.org/ Apache Kafka 是一个开源消息系统,由Scala 写成。是由Apache 软件基金会开发的一个开源消息系统项目。 Kafka 最初是由LinkedIn 开发,并于2011 年初开源。2 阅读全文
posted @ 2019-09-09 10:11 独孤风 阅读(2049) 评论(0) 推荐(8) 编辑
摘要: 实现批处理的技术许许多多,从各种关系型数据库的sql处理,到大数据领域的MapReduce,Hive,Spark等等。这些都是处理有限数据流的经典方式。而Flink专注的是无限流处理,那么他是怎么做到批处理的呢? 无限流处理:输入数据没有尽头;数据处理从当前或者过去的某一个时间 点开始,持续不停地进 阅读全文
posted @ 2019-09-06 10:34 独孤风 阅读(13358) 评论(0) 推荐(1) 编辑
摘要: Yahoo 的 Storm 团队曾发表了一篇博客文章 ,并在其中展示了 Storm、Flink 和 Spark Streaming 的性能测试结果。该测试对于业界而言极 具价值,因为它是流处理领域的第一个基于真实应用程序的基准测试。 该应用程序从 Kafka 消费广告曝光消息,从 Redis 查找每 阅读全文
posted @ 2019-09-05 10:28 独孤风 阅读(8143) 评论(0) 推荐(1) 编辑
摘要: Kafka在0.10.0.0版本以前的定位是分布式,分区化的,带备份机制的日志提交服务。而kafka在这之前也没有提供数据处理的顾服务。大家的流处理计算主要是还是依赖于Storm,Spark Streaming,Flink等流式处理框架。 Storm,Spark Streaming,Flink流处理 阅读全文
posted @ 2019-09-04 11:14 独孤风 阅读(12270) 评论(0) 推荐(2) 编辑
摘要: 流式计算分为无状态和有状态两种情况。无状态计算观察每个独立的事件,Storm就是无状态的计算框架,每一条消息来了以后和前后都没有关系,一条是一条。比如我们接收电力系统传感器的数据,当电压超过240v就报警,这就是无状态的数据。但是如果我们需要同时判断多个电压,比如三相电路,我们判断三相电都高于某个值 阅读全文
posted @ 2019-09-03 17:47 独孤风 阅读(2373) 评论(0) 推荐(0) 编辑
摘要: Flink对于流处理架构的意义十分重要,Kafka让消息具有了持久化的能力,而处理数据,甚至穿越时间的能力都要靠Flink来完成。 在Streaming-大数据的未来一文中我们知道,对于流式处理最重要的两件事,正确性,时间推理工具。而Flink对两者都有非常好的支持。 Flink对于正确性的保证 对 阅读全文
posted @ 2019-09-02 12:35 独孤风 阅读(1356) 评论(1) 推荐(3) 编辑
摘要: 我们知道过去对于Kafka的定义是分布式,分区化的,带备份机制的日志提交服务。也就是一个分布式的消息队列,这也是他最常见的用法。但是Kafka不止于此,打开最新的官网。 我们看到Kafka最新的定义是:Apache Kafka® is a distributed streaming platform 阅读全文
posted @ 2019-08-30 11:25 独孤风 阅读(4242) 评论(0) 推荐(0) 编辑