+
摘要: ![](https://img2020.cnblogs.com/blog/1678180/202009/1678180-20200927141820874-480468005.png) 阅读全文
posted @ 2020-09-27 14:18 鸭血粉丝汤 阅读(210) 评论(0) 推荐(0)
摘要: 2017年时序数据库忽然火了起来。开年2月Facebook开源了beringei时序数据库;到了4月基于PostgreSQL打造的时序数据库TimeScaleDB也开源了,而早在2016年7月,百度云在其天工物联网平台上发布了国内首个多租户的分布式时序数据库产品TSDB,成为支持其发展制造,交通,能 阅读全文
posted @ 2020-09-21 15:44 鸭血粉丝汤 阅读(271) 评论(0) 推荐(0)
摘要: 技术栈 一图胜千言,如图是所使用的大数据组件,离线数仓的搭建涉及Kafka、Flume、Sqoop、Hive,实时路线包含Kafka、SparkStreaming、Kudu,最终的展示由Impala查询Hive和Kudu上相关数据,作OLAP分析,分析结果由Tableau展示 离线数仓采集 Kafk 阅读全文
posted @ 2020-08-31 14:17 鸭血粉丝汤 阅读(301) 评论(0) 推荐(0)
摘要: 上篇文章 Apache Flink 基础概念和解析 一、Flink 开发环境部署和配置 Flink 是一个以 Java 及 Scala 作为开发语言的开源大数据项目,代码开源在 GitHub 上,并使用 Maven 来编译和构建项目。对于大部分使用 Flink 的同学来说,Java、Maven 和 阅读全文
posted @ 2020-08-26 16:00 鸭血粉丝汤 阅读(277) 评论(0) 推荐(0)
摘要: 本文转载自|Apache Flink China社区|作者:陈守元 & 戴资力https://ververica.cn/developers/flink-basic-tutorial-1-basic-concept/ 一、Flink的定义及原理和架构 Apache Flink是第三代分布式流计算引擎 阅读全文
posted @ 2020-08-24 11:36 鸭血粉丝汤 阅读(207) 评论(0) 推荐(0)
/* 鼠标点击求赞文字特效 */