会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
技术栈
匠人精神,持之以恒!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
13
14
15
16
17
18
19
20
21
···
37
下一页
2022年8月24日
【云原生】Kubernetes(k8s)——本地存储卷介绍与简单使用(emptyDir,hostPath,local volume)
摘要: 一、概述 存储卷,简称卷,卷是pod的一部分,卷在pod创建时创建,删除pod时卷也会被销毁,卷可以为pod中的所有容器使用,前提是所有容器都将卷挂载到容器里,卷可以挂载到容器的文件系统中的任意位置。一个pod可以定义多个不同类型的卷,一个容器也可以使用不同类型的多个卷。pod需要设置卷来源(spe
阅读全文
posted @ 2022-08-24 22:39 大数据老司机
阅读(2973)
评论(0)
推荐(0)
2022年8月23日
【云原生】rsync+inotify数据实时同步介绍与k8s实战应用
摘要: 一、rsync概述 rsync(remote sync)远程同步,rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。已支持跨平台,可以在Windows与Linux间进行数据同步。 rsync监听
阅读全文
posted @ 2022-08-23 22:13 大数据老司机
阅读(990)
评论(0)
推荐(0)
2022年8月22日
【云原生】Kubernetes(k8s)最新版最完整版环境部署+master高可用实现(k8sV1.24.1+dashboard+harbor)
摘要: 一、前言 其实之前已经部署过了1.22.1版本了,基础概念和细节的东西这里就不再重复了,小伙伴可以参考我之前的文章哦: Kubernetes(k8s)基础概念介绍 Kubernetes(k8s)安装以及搭建k8s-Dashboard详解 Kubernetes(k8s) YAML文件详解 Kubern
阅读全文
posted @ 2022-08-22 23:19 大数据老司机
阅读(4454)
评论(0)
推荐(2)
2022年8月21日
大数据Hadoop之——HDFS小文件问题与处理实战操作
摘要: 一、背景 每个文件均按块存储,每个块的元数据存储在NameNode的内存中,因此HDFS存储小文件会非常低效。因为大量的小文件会耗尽NameNode中的大部分内存。但注意,存储小文件所需要的磁盘容量和数据块的大小无关。每个块的大小可以通过配置参数(dfs.blocksize)来规定,默认的大小128
阅读全文
posted @ 2022-08-21 18:46 大数据老司机
阅读(4397)
评论(0)
推荐(1)
大数据Hadoop之——Hadoop HDFS多目录磁盘扩展与数据平衡实战操作
摘要: 一、概述 hdfs 需要存写大量文件,有时磁盘会成为整个集群的性能瓶颈,所以需要优化 hdfs 存取速度,将数据目录配置多磁盘,既可以提高并发存取的速度,还可以解决一块磁盘空间不够的问题。 Hadoop 环境部署可以参考我之前的文章:大数据Hadoop之——Hadoop 3.3.4 HA(高可用)原
阅读全文
posted @ 2022-08-21 08:42 大数据老司机
阅读(2463)
评论(0)
推荐(0)
2022年8月20日
大数据Hadoop之——Hadoop 3.3.4 HA(高可用)原理与实现(QJM)
摘要: 一、前言 在 Hadoop 2.0.0 之前,一个集群只有一个Namenode,这将面临单点故障问题。如果 Namenode 机器挂掉了,整个集群就用不了了。只有重启 Namenode ,才能恢复集群。另外正常计划维护集群的时候,还必须先停用整个集群,这样没办法达到 7 * 24小时可用状态。Had
阅读全文
posted @ 2022-08-20 11:37 大数据老司机
阅读(4268)
评论(1)
推荐(2)
2022年8月14日
Spark开源REST服务——Apache Livy(Spark 客户端)
摘要: 一、概述 Livy是一个提供Rest接口和spark集群交互的服务。它可以提交Spark Job或者Spark一段代码,同步或者异步的返回结果;也提供Sparkcontext的管理,通过Restful接口或RPC客户端库。Livy也简化了与Spark与应用服务的交互,这允许通过web/mobile与
阅读全文
posted @ 2022-08-14 19:22 大数据老司机
阅读(2614)
评论(0)
推荐(1)
2022年8月13日
列式存储的分布式数据库——HBase Shell与SQL实战操作(HBase Master高可用实现)
摘要: 一、前言 HBase的基本概念和环境部署,可以参考我之前的文章:列式存储的分布式数据库——HBase(环境部署) 二、命令行操作(hbase shell) 1)连接HBase 官方文档:https://hbase.apache.org/book.html#shell # 启动hbase服务,已启动可
阅读全文
posted @ 2022-08-13 18:27 大数据老司机
阅读(939)
评论(0)
推荐(0)
2022年8月12日
列式存储的分布式数据库——HBase(环境部署)
摘要: 一、概述 HBase 是一个面向列式存储的分布式数据库,其设计思想来源于 Google 的 BigTable 论文。HBase 底层存储基于 HDFS 实现,集群的管理基于 ZooKeeper 实现。HBase 良好的分布式架构设计为海量数据的快速存储、随机访问提供了可能,基于数据副本机制和分区机制
阅读全文
posted @ 2022-08-12 23:38 大数据老司机
阅读(1581)
评论(0)
推荐(0)
2022年8月8日
高性能分布式对象存储——MinIO实战操作(MinIO扩容)
摘要: 一、前言 MinIO的基础概念和环境部署可以参考我之前的文章:高性能分布式对象存储——MinIO(环境部署) 二、客户端操作MinIO Client(mc) 官方文档:https://docs.min.io/docs/minio-admin-complete-guide.html MinIO Cli
阅读全文
posted @ 2022-08-08 00:02 大数据老司机
阅读(14131)
评论(2)
推荐(3)
上一页
1
···
13
14
15
16
17
18
19
20
21
···
37
下一页
公告