会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
技术栈
匠人精神,持之以恒!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
37
下一页
2023年7月9日
Hadoop on k8s 编排部署进阶篇
摘要: [TOC] ## 一、概述 `Hadoop` 是一个开源的分布式计算框架,用于处理大规模数据集的存储和处理。它使用了 `Hadoop` 分布式文件系统`(Hadoop Distributed File System,HDFS)`来存储数据,并通过 `MapReduce` 编程模型进行数据处理。 ![
阅读全文
posted @ 2023-07-09 18:17 大数据老司机
阅读(3400)
评论(1)
推荐(1)
2023年6月25日
【大数据】通过 docker-compose 快速部署 MinIO 保姆级教程
摘要: [TOC] ## 一、概述 `MinIO` 是一个开源的**对象存储服务器**,它兼容`Amazon S3(Simple Storage Service)API`。它被设计用于构建分布式存储架构,提供高可用性、高性能和可扩展的对象存储解决方案。 下面是MinIO的一些主要特点和功能: - **对象存
阅读全文
posted @ 2023-06-25 22:01 大数据老司机
阅读(3356)
评论(0)
推荐(0)
2023年6月24日
【大数据】通过 docker-compose 快速部署 ClickHouse 保姆级教程
摘要: [TOC] ## 一、概述 > ClickHouse是一种**高性能、列式存储的分布式数据库管理系统**。它专注于快速数据分析和查询,并且在大规模数据集上表现出色。 在ClickHouse中,数据按列存储而不是按行存储。这种存储方式有许多优点,特别适合分析工作负载。下面是一些与列数据存储相关的关键概
阅读全文
posted @ 2023-06-24 18:33 大数据老司机
阅读(4113)
评论(0)
推荐(0)
2023年6月20日
通过 docker-compose 快速部署 DolphinScheduler 保姆级教程
摘要: [TOC] ## 一、概述 `Apache DolphinScheduler`(简称DolphinScheduler)是一种开源的、分布式的、易于使用的大数据工作流调度系统。它旨在为大数据处理提供一个可靠、高效和可扩展的调度解决方案。 
评论(0)
推荐(0)
2023年6月19日
Apache DolphinScheduler(海豚调度系统)介绍与环境部署
摘要: [TOC] ## 一、概述 `Apache DolphinScheduler`(简称`DolphinScheduler`)是一种开源的、分布式的、易于使用的大数据工作流调度系统。它旨在为大数据处理提供一个可靠、高效和可扩展的调度解决方案。 DolphinScheduler具有以下特点和功能: - *
阅读全文
posted @ 2023-06-19 23:44 大数据老司机
阅读(4194)
评论(0)
推荐(0)
2023年6月18日
通过 docker-compose 快速部署 Apache Ambari 保姆级教程
摘要: [TOC] ## 一、概述 `Apache Ambari` **是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。** Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、H
阅读全文
posted @ 2023-06-18 19:26 大数据老司机
阅读(1439)
评论(0)
推荐(0)
2023年6月13日
【大数据】大数据 Hadoop 管理工具 Apache Ambari(HDP)
摘要: [TOC] ## 一、概述 `Apache Ambari` **是 Hortonworks 贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视 Hadoop 集群。** Ambari 目前已支持大多数 Hadoop 组件,包括 HDFS、MapReduce、H
阅读全文
posted @ 2023-06-13 22:48 大数据老司机
阅读(9347)
评论(0)
推荐(1)
2023年6月12日
通过 docker-compose 快速部署 StarRocks 保姆级教程
摘要: [TOC] ## 一、概述 StarRocks是一个开源的分布式OLAP(在线分析处理)数据库,旨在提供高性能、低延迟的数据分析和查询能力。它最初由中国的猎豹移动公司(Cheetah Mobile)开发,并于2016年开源。 StarRocks主要特点和功能包括: - **列式存储**:StarRo
阅读全文
posted @ 2023-06-12 22:00 大数据老司机
阅读(2979)
评论(2)
推荐(0)
2023年6月11日
通过 docker-compose 快速部署 Azkaban 保姆级教程
摘要: [TOC] ## 一、概述 `Apache Azkaban` 是一个开源的批处理**工作流调度系统**,用于管理和调度Hadoop生态系统中的任务和作业。 - `Azkaban` 提供了一个直观的Web界面,让用户能够轻松地定义、调度和监控作业流。它支持工作流的可视化编辑,可以将任务以依赖关系的方式
阅读全文
posted @ 2023-06-11 18:20 大数据老司机
阅读(701)
评论(0)
推荐(0)
2023年6月4日
通过 docker-compose 快速部署 HBase 保姆级教程
摘要: [TOC] ## 一、概述 `HBase` 是一个开源的 `NoSQL` **列式分布式数据库**,它主要基于 `Hadoop` 分布式文件系统(HDFS)运行。`HBase` 最初是由 `Facebook` 公司贡献,其基于 `Google`的 `Bigtable` 模型开发,在强大的水平扩展性和
阅读全文
posted @ 2023-06-04 16:20 大数据老司机
阅读(2275)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
37
下一页
公告