上一页 1 2 3 4 5 6 7 ··· 14 下一页
摘要: 云原生时代顶流消息中间件Apache Pulsar部署实操之轻量级计算框架 本篇逐层递进了解Pulsar Functions的基本概念和理论,如工作原理、处理保证模式、窗口函数;进一步搭建Pulsar函数运行环境,一步步操作演示函数也包括窗口函数的示例使用,最后通过Java语言实现原生语言接口和Pulsar函数SDK两种方式的代码示例、打包、部署和结果验证。 阅读全文
posted @ 2023-03-07 18:10 itxiaoshen 阅读(441) 评论(0) 推荐(0)
摘要: 云原生时代顶流消息中间件Apache Pulsar部署实操-上 本篇先部署Apache Pulsar 最新版本2.11.0的 Locally Standalone,并通过创建Topic、生产消息和消费消息验证基础环境;接着通过二进制也即是所谓裸机部署方式一步步演示如何部署Pulsar的分布式集群,并通过Admin客户端验证基于租户、命名空间一些消息管理和使用简单功能。最后介绍Pulsar 层级存储的工作原理和使用场景,如何使用待续... 阅读全文
posted @ 2023-02-14 12:30 itxiaoshen 阅读(497) 评论(0) 推荐(0)
摘要: 开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-下 本篇先通过Kylin对连接条件、维度和度量限制的示例弄清Kylin的使用注意事项,在此基础上研究Kylin查询引擎,并配置spark查询下压实现没有cube的查询;理解Cube的构建优化,通过官方提供RestAPI实现动态灵活查询和cube构建,最后通过集成JDBC的Java代码实现简单查询操作。 阅读全文
posted @ 2023-02-11 00:11 itxiaoshen 阅读(225) 评论(0) 推荐(0)
摘要: 开源分布式支持超大规模数据分析型数据仓库Apache Kylin实践-上 再下一城又一个实时多维交互式分析数仓利器,了解其特性和架构组成,进一步阐述相关概念和其生态圈;介绍作为开发测试最快捷方式的Docker单机部署;也基于Hadoop环境一步步部署最新v4.0.3二进制并解决遇到的问题,最后通过一个读取hive数据示例介绍kylin创建项目、选择数据源、创建Model、创建Cube、Cube的构建,全面认识kylin预计算查询强悍。 阅读全文
posted @ 2023-02-09 23:42 itxiaoshen 阅读(518) 评论(0) 推荐(1)
摘要: 大数据实时多维OLAP分析数据库Apache Druid入门分享-下 了解Apache Druid的基础概念后,本篇进一步研究其核心架构和核心设计原理部分,了解相关外部依赖,对其数据摄取和查询有一定认识,然后通过搭建分布式集群进一步理解其架构组成,最后用一个示例从HDFS将数据摄取到Druid并演示两种查询方式 阅读全文
posted @ 2023-02-01 23:39 itxiaoshen 阅读(524) 评论(2) 推荐(0)
摘要: 大数据实时多维OLAP分析数据库Apache Druid入门分享-上 Apache Druid是⼀款针对海量数据进⾏⾼性能实时分析OLAP引擎的实时分析型数据库,本篇了解其特征和适用场景,并与其他框架横向对比;最后部署一个最新版本25.0.0单机版演示本地文件摄取入库,并演示基于Json API本地查询和SQL两种查询方式 阅读全文
posted @ 2023-01-31 23:16 itxiaoshen 阅读(1242) 评论(0) 推荐(0)
摘要: 比Sqoop功能更加强大开源数据同步工具DataX实战 前面两篇连续介绍两个数据同步组件后,好事应有三,大满贯收场,本篇介绍主流的异构数据源离线同步工具DataX的框架设计和执行流程,将其与大名鼎鼎大数据同步组件Sqoop做对比,部署安装并通过配置基于MySQL和HDFS互为读写的实例场景和关键配置说明。 阅读全文
posted @ 2022-12-23 21:51 itxiaoshen 阅读(1276) 评论(1) 推荐(3)
摘要: 实时采集MySQL数据之轻量工具Maxwell实操 一个用于企业应用支持实时增量采集和全量采集MySQL数据开源框架Maxwell,功能强于Canal,比Flink CDC更易用。本篇先了解其定义和原理,然后通过安装和环境准备,了解其启动的两种方式,最后实操演示几个maxwell在企业中常用的场景示例。 阅读全文
posted @ 2022-12-19 23:16 itxiaoshen 阅读(1884) 评论(0) 推荐(3)
摘要: 可视化编排的数据集成和分发开源框架Nifi轻松入门-上 如何你正在为数据采集做技术选型,今天介绍一款功能极其强大性能也高且采用可视化编排的数据集成框架nifi可以列入选型范畴,是数仓开发的强大工具之一,只要使用后就能体会到其丰富的处理器和扩展性。先了解其特性、核心概念和架构,也支持分布式集群,了解常见处理器分类,最后通过源码安装并使用两个简单的处理器演示一个基础入门示例 阅读全文
posted @ 2022-12-14 00:01 itxiaoshen 阅读(1281) 评论(0) 推荐(0)
摘要: 秒级查询之开源分布式SQL查询引擎Presto实操-上 大数据交互式查询是每个数据分析人员不可或缺的需求,本篇以业界交互式查询的经典之作Presto为研究对象,了解其架构和优缺点及丰富连接器。并通过安装一个协调节点和3个worker节点的分布式集群,使用命令行界面演示hive连接器的查询数据表的示例,最后了解其使用的要点。 阅读全文
posted @ 2022-12-08 22:48 itxiaoshen 阅读(1403) 评论(0) 推荐(1)
上一页 1 2 3 4 5 6 7 ··· 14 下一页