上一页 1 ··· 319 320 321 322 323 324 325 326 327 ··· 385 下一页
摘要: 1 产生传感器读数代码编写(读取数据源) 1.1 从批读取数据 scala version val stream = env .fromElements( SensorReading("sensor_1", 1547718199, 35.80018327300259), SensorReading( 阅读全文
posted @ 2020-08-03 21:14 秋华 阅读(1330) 评论(0) 推荐(0)
摘要: 本章介绍了Flink DataStream API的基本知识。我们展示了典型的Flink流处理程序的结构和组成部分,还讨论了Flink的类型系统以及支持的数据类型,还展示了数据和分区转换操作。窗口操作符,基于时间语义的转换操作,有状态的操作符,以及和外部系统的连接器将在接下来的章节进行介绍。阅读完这 阅读全文
posted @ 2020-08-03 20:49 秋华 阅读(1012) 评论(0) 推荐(0)
摘要: 1 在IDEA中编写Flink程序 Scala版Flink程序编写 本项目使用的Flink版本为最新版本,也就是1.11.0。现在提供maven项目的配置文件。 使用Intellij IDEA创建一个Maven新项目 勾选Create from archetype,然后点击Add Archetype 阅读全文
posted @ 2020-08-03 19:54 秋华 阅读(1221) 评论(0) 推荐(0)
摘要: 1 系统架构 Flink是一个用于有状态的并行数据流处理的分布式系统。它由多个进程构成,这些进程一般会分布运行在不同的机器上。对于分布式系统来说,面对的常见问题有:集群中资源的分配和管理、进程协调调度、持久化和高可用的数据存储,以及故障恢复。 对于这些分布式系统的经典问题,业内已有比较成熟的解决方案 阅读全文
posted @ 2020-08-03 18:54 秋华 阅读(1543) 评论(0) 推荐(0)
摘要: 1 数据流编程简介 在我们深入研究流处理的基础知识之前,让我们来看看在数据流程编程的背景和使用的术语。 1.1 数据流图 顾名思义,数据流程序描述了数据如何在算子之间流动。数据流程序通常表示为有向图,其中节点称为算子,用来表示计算,边表示数据之间的依赖性。算子是数据流程序的基本功能单元。他们从输入消 阅读全文
posted @ 2020-08-03 17:39 秋华 阅读(1443) 评论(0) 推荐(0)
摘要: 1 初识 Flink Flink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。 Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行,以内存执 阅读全文
posted @ 2020-08-03 17:24 秋华 阅读(895) 评论(0) 推荐(0)
摘要: 0 简介 Apache Flink是一个分布式流处理器,具有直观和富有表现力的API,可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。 Flink于2014年4月加入Apache软件基金会作为孵化项目,并于2015年1月成为顶级项目。从一开始,Flink就拥有一个非常活跃且 阅读全文
posted @ 2020-08-03 17:16 秋华 阅读(2197) 评论(0) 推荐(0)
摘要: 从之前章节的介绍可以知道,在没有采取任何优化措施的情况下,Kylin会对每一种维度的组合进行预计算,每种维度的组合的预计算结果被称为Cuboid。假设有4个维度,我们最终会有24 =16个Cuboid需要计算。 但在现实情况中,用户的维度数量一般远远大于4个。假设用户有10 个维度,那么没有经过任何 阅读全文
posted @ 2020-07-31 17:13 秋华 阅读(628) 评论(0) 推荐(0)
摘要: 可以与Kylin结合使用的可视化工具很多,例如: ODBC:与Tableau、Excel、PowerBI等工具集成 JDBC:与Saiku、BIRT等Java工具集成 RestAPI:与JavaScript、Web网页集成 Kylin开发团队还贡献了Zepplin的插件,也可以使用Zepplin来访 阅读全文
posted @ 2020-07-31 17:03 秋华 阅读(840) 评论(0) 推荐(0)
摘要: 需求:实现按照维度(工作地点)统计员工信息 1 数据准备 在Hive中创建数据,分别创建部门和员工外部表,并向表中导入数据。 (1)原始数据 (2)建表语句 创建部门表 create external table if not exists default.dept( deptno int, dna 阅读全文
posted @ 2020-07-31 16:51 秋华 阅读(685) 评论(0) 推荐(0)
上一页 1 ··· 319 320 321 322 323 324 325 326 327 ··· 385 下一页