上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 24 下一页
摘要: 本文选自《实时流计算系统设计与实现》 文末有惊喜 状态管理是流计算系统的核心问题之一。在实现流数据的关联操作时,流计算系统需要先将窗口内的数据临时保存起来,然后在窗口结束时,再对窗口内的数据做关联计算。在实现时间维度聚合特征计算和关联图谱特征计算时,更是需要创建大量的寄存用于记录聚合的结果。而CEP 阅读全文
posted @ 2020-05-06 09:30 独孤风 阅读(1025) 评论(0) 推荐(0) 编辑
摘要: 实时数据分析门槛较高,我们如何用极少的开发工作就完成实时数据平台的搭建,做出炫酷的图表呢? 如何快速的搭建实时数据分析平台,首先我们需要实时数据的接入端,我们选择高扩展性、容错性、速度极快的消息系统Kafka,而实时数据仓库,由于 Druid提供了非常方便快捷配置方式,如果不想编写负责的Flink和 阅读全文
posted @ 2020-04-28 14:08 独孤风 阅读(2373) 评论(0) 推荐(3) 编辑
摘要: Apache Druid本质就是一个分布式支持实时数据分析的数据存储系统。 能够快速的实现查询与数据分析,高可用,高扩展能力。 距离上一次更新刚过了二十多天,距离0.17版本刚过了三个多月,Druid再次迎来重大更新,Druid也越来越强大了。 Apache Druid 0.18.0 本次更新了 4 阅读全文
posted @ 2020-04-27 15:39 独孤风 阅读(2307) 评论(0) 推荐(2) 编辑
摘要: 1.设置用户环境变量vi .bash_profile 或者是 vi ~/.bashrc 2.JAVA_HOME=/home/sgmm/jdk1.6.0_13 CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib PATH=$PATH:$JAVA_HOME/bin:$ 阅读全文
posted @ 2020-04-26 14:39 独孤风 阅读(1523) 评论(0) 推荐(0) 编辑
摘要: 本课程源码共享于 https://github.com/tree1123/learning-scala 首先,打开IDEA编辑器的SbtExampleProject项目,我们将在这个项目下进行练习 本节的练习内容位于 com.tree1123.Base 中 新建一个main函数 一 、声明值和变量 阅读全文
posted @ 2020-04-26 13:43 独孤风 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 近日Kafka发布了最新版本 2.5.0,增加了很多新功能: 下载地址:https://kafka.apache.org/downloads#2.5.0 对TLS 1.3的支持(默认为1.2) 引入用于 Kafka Streams 的 Co-groups 用于 Kafka Consumer 的增量 阅读全文
posted @ 2020-04-20 09:28 独孤风 阅读(2426) 评论(0) 推荐(0) 编辑
摘要: GitHub CEO Nat Friedman 宣布已面向全体 GitHub 用户和团队提供不限制协作人数的私有仓库,并宣称 GitHub 的全部核心功能现已对所有人免费提供。 公告称: 到目前为止,如果您的组织要使用GitHub进行私有开发,则必须订阅我们的付费计划之一。但是地球上的每个开发人员都 阅读全文
posted @ 2020-04-15 09:11 独孤风 阅读(694) 评论(1) 推荐(0) 编辑
摘要: 作为全球新冠疫情数据的实时统计的权威,约翰斯—霍普金斯大学的实时数据一直是大家实时关注的,也是各大媒体的主要数据来源。在今天早上的相当一段长的时间,霍普金斯大学的全球疫情分布大屏中显示,全球确诊人数已经突破200万。 有图有真相 随后相关媒体也进行了转发,不过这个数据明显波动太大,随后该网站也修改了 阅读全文
posted @ 2020-04-14 09:49 独孤风 阅读(1173) 评论(0) 推荐(0) 编辑
摘要: Scala下载地址:https://www.scala-lang.org/download/ 一、安装JDK 首先,因为Scala是运行在JVM平台上的,所以安装Scala之前要安装JDK 二、二进制安装方式 我们可以直接用二进制安装Scala 还是下载网址 Windows安装Scala编译器 访问 阅读全文
posted @ 2020-04-13 09:05 独孤风 阅读(725) 评论(0) 推荐(1) 编辑
摘要: 为什么是Scala 虽然在大数据领域Java的使用更普及,Python也有后来居上的势头,但Scala一直有着不可动摇的地位。我们熟悉的Spark,Kafka,Flink都是由Scala完成了其核心代码的开发。 所以掌握Scala不仅可以学习大数据组件的源码,而且会极大的提升大数据开发的效率。 这也 阅读全文
posted @ 2020-04-10 11:05 独孤风 阅读(1191) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 24 下一页