08 2020 档案
摘要:技术栈 一图胜千言,如图是所使用的大数据组件,离线数仓的搭建涉及Kafka、Flume、Sqoop、Hive,实时路线包含Kafka、SparkStreaming、Kudu,最终的展示由Impala查询Hive和Kudu上相关数据,作OLAP分析,分析结果由Tableau展示 离线数仓采集 Kafk
阅读全文
摘要:上篇文章 Apache Flink 基础概念和解析 一、Flink 开发环境部署和配置 Flink 是一个以 Java 及 Scala 作为开发语言的开源大数据项目,代码开源在 GitHub 上,并使用 Maven 来编译和构建项目。对于大部分使用 Flink 的同学来说,Java、Maven 和
阅读全文
摘要:本文转载自|Apache Flink China社区|作者:陈守元 & 戴资力https://ververica.cn/developers/flink-basic-tutorial-1-basic-concept/ 一、Flink的定义及原理和架构 Apache Flink是第三代分布式流计算引擎
阅读全文

浙公网安备 33010602011771号