摘要:         存算分离是下一代企业大数据必然趋势,本篇先简述存算分离背景以及为何要进行存算分离,当前存算分离主要优势和实际应用场景。并归纳分析若干如华为Ocean系列、JuiceFs、HashData等市面上存算分离产品和解决方案。    阅读全文
存算分离是下一代企业大数据必然趋势,本篇先简述存算分离背景以及为何要进行存算分离,当前存算分离主要优势和实际应用场景。并归纳分析若干如华为Ocean系列、JuiceFs、HashData等市面上存算分离产品和解决方案。    阅读全文
 存算分离是下一代企业大数据必然趋势,本篇先简述存算分离背景以及为何要进行存算分离,当前存算分离主要优势和实际应用场景。并归纳分析若干如华为Ocean系列、JuiceFs、HashData等市面上存算分离产品和解决方案。    阅读全文
存算分离是下一代企业大数据必然趋势,本篇先简述存算分离背景以及为何要进行存算分离,当前存算分离主要优势和实际应用场景。并归纳分析若干如华为Ocean系列、JuiceFs、HashData等市面上存算分离产品和解决方案。    阅读全文
posted @ 2022-10-12 23:05
itxiaoshen
阅读(1910)
评论(0)
推荐(5)
        
 
                    
                     
                    
                 
                    
                
 上一篇对Hbase底层原理有一定理解后则进入生产开发实战,企业开发大都使用Phoenix来操作Hbase的数据,先部署Phoenix,通过其类似shell命令工具创建表和插入数据及查询数据、表映射,简易JDBC演示示例,实操理解二级索引使用,最后通过整合Hive若干示例实现对Hbase的数据的简易分析能力。
上一篇对Hbase底层原理有一定理解后则进入生产开发实战,企业开发大都使用Phoenix来操作Hbase的数据,先部署Phoenix,通过其类似shell命令工具创建表和插入数据及查询数据、表映射,简易JDBC演示示例,实操理解二级索引使用,最后通过整合Hive若干示例实现对Hbase的数据的简易分析能力。     上一篇我们了解HBase基础知识,本篇则针对Hbase底层原理深入了解Master和RegionServer的架构,剖析Hbase的读写流程以及非常重要的写缓存刷写和文件合并机制,掌握预定义分区和系统拆分,最后通过封装Java API编程连接类、DDL操作类、DML操作类及其演示的示例代码结果结尾。
上一篇我们了解HBase基础知识,本篇则针对Hbase底层原理深入了解Master和RegionServer的架构,剖析Hbase的读写流程以及非常重要的写缓存刷写和文件合并机制,掌握预定义分区和系统拆分,最后通过封装Java API编程连接类、DDL操作类、DML操作类及其演示的示例代码结果结尾。     要想入门大数据理论和原理必先研究HBase,体会其设计精髓,本篇先介绍其基础架构和应用场景、逻辑结构和物理存储结构进一步理解其数据模型,通过详细完整步骤一步步的安装最新版本2.5高可用的Hbase集群以加深理解其整体架构,最后通过实操Hbase Shell基础命令和DDL、DMl等常用命令。
要想入门大数据理论和原理必先研究HBase,体会其设计精髓,本篇先介绍其基础架构和应用场景、逻辑结构和物理存储结构进一步理解其数据模型,通过详细完整步骤一步步的安装最新版本2.5高可用的Hbase集群以加深理解其整体架构,最后通过实操Hbase Shell基础命令和DDL、DMl等常用命令。     Tekton以yaml文件编排应用构建及部署流程,是一个纯云原生的标准化CICD流水线构建、测试和部署流程的工具,本篇先介绍其使用好处、主要组件、并一步步部署和简单演示任务和管道的简易使用。
Tekton以yaml文件编排应用构建及部署流程,是一个纯云原生的标准化CICD流水线构建、测试和部署流程的工具,本篇先介绍其使用好处、主要组件、并一步步部署和简单演示任务和管道的简易使用。     ArgoCD是Kubernetes的声明式、GitOps连续交付工具,通过Kubernetes控制器来实现。本篇介绍ArgoCD基本功能、组件和工作流程,也介绍通过kubekey部署简单K8S集群和基于K9S简易管理K8S集群,并通过K8S部署ArgoCD,通过二进制部署和配置ArgoCD的命令行工具,最后以一个官方示例演示ArgoCD创建APP的简易示例入门。
ArgoCD是Kubernetes的声明式、GitOps连续交付工具,通过Kubernetes控制器来实现。本篇介绍ArgoCD基本功能、组件和工作流程,也介绍通过kubekey部署简单K8S集群和基于K9S简易管理K8S集群,并通过K8S部署ArgoCD,通过二进制部署和配置ArgoCD的命令行工具,最后以一个官方示例演示ArgoCD创建APP的简易示例入门。     Hive与Spark之间整合有3种模式,本篇从Hive on Spark和Spark on Hive的使用出发,hive支持mr、tez和spark三种底层计算引擎,通过部署Hive on Spark环境实现Hive用到Spark的体验,Spark on Hive的使用则比较简单直接通过SQL操作Hive,最后罗列常见的一些大数据性能调优方法。
Hive与Spark之间整合有3种模式,本篇从Hive on Spark和Spark on Hive的使用出发,hive支持mr、tez和spark三种底层计算引擎,通过部署Hive on Spark环境实现Hive用到Spark的体验,Spark on Hive的使用则比较简单直接通过SQL操作Hive,最后罗列常见的一些大数据性能调优方法。     本篇先了解Spark和Hadoop的关系与区别,进一步了解特性和相关组件架构;通过实战部署了Spark最新版本3.3.0的Local、Standalone+历史服务+HA、Yarn的部署完成操作步骤,并通过不同提交方式的示例和WebUI查看加深多Spark多种作业提交原理的理解,并拉开了使用Spark-Shell方式提交本地、集群、yarn交互式使用之门。
本篇先了解Spark和Hadoop的关系与区别,进一步了解特性和相关组件架构;通过实战部署了Spark最新版本3.3.0的Local、Standalone+历史服务+HA、Yarn的部署完成操作步骤,并通过不同提交方式的示例和WebUI查看加深多Spark多种作业提交原理的理解,并拉开了使用Spark-Shell方式提交本地、集群、yarn交互式使用之门。     Hive是一个建立在Hadoop HDFS架构至上的数仓工具,管理元数据但本身不存储数据,本篇了解hive优缺点,进一步理解其组成部分和数据组织形式和Driver,最后通过部署最新版本3.1.3版本完成内嵌模式、本地metastore、远程hiveserver2和metastore打开进入hive使用的大门
Hive是一个建立在Hadoop HDFS架构至上的数仓工具,管理元数据但本身不存储数据,本篇了解hive优缺点,进一步理解其组成部分和数据组织形式和Driver,最后通过部署最新版本3.1.3版本完成内嵌模式、本地metastore、远程hiveserver2和metastore打开进入hive使用的大门     Ceph实现了分布式统一的存储,既支持对象存储、块设备存储还支持文件系统,不失为目前最成熟稳定的存储解决方案,本篇先了解传统存储问题和Ceph的优势,介绍总体架构和组成部分,说明官网文档部署和部署版本建议,了解几种部署方式,最后通过Cephadm快速部署一个简单暂无存储节点的集群,后续可以在此基础上进行高可用节点的和存储节点的扩缩容
Ceph实现了分布式统一的存储,既支持对象存储、块设备存储还支持文件系统,不失为目前最成熟稳定的存储解决方案,本篇先了解传统存储问题和Ceph的优势,介绍总体架构和组成部分,说明官网文档部署和部署版本建议,了解几种部署方式,最后通过Cephadm快速部署一个简单暂无存储节点的集群,后续可以在此基础上进行高可用节点的和存储节点的扩缩容     
         浙公网安备 33010602011771号
浙公网安备 33010602011771号