摘要:        
关注公众号 singless ,后台回复bcache,获取bcache相关资料1 介绍 1.1 背景介绍 Bcache是Linux内核块设备层的软件驱动,使用高速存储设备为传统机械磁盘做IO缓存,经常访问的热数据会缓存在固态硬盘中并直接返回给应用程序,大大提升了具有热数据访问特征的应用场景的IO性能    阅读全文
        
            posted @ 2025-10-29 14:22
singless233
阅读(14)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
本文基于Ceph P版,适用于ceph-deploy部署非容器化部署场景。 完整版PDF下载链接请点击以下链接 https://mp.weixin.qq.com/s/57zn-a4zZ4Dc2mBhsa23PQ 修订记录 版本 时间 修订人 V1.0 2024年03月06号 singless 目录     阅读全文
        
            posted @ 2025-10-29 14:19
singless233
阅读(11)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
在业务中如果有数据持久化存储的需求就免不了要使用到PV、PVC,既然使用了PV和PVC那么它们的容量使用情况也是我们需要关注的。目前K8S并未提供接口让我们可以直接查询到PVC的容量使用情况,因此本文主要介绍K8S环境下两种查询PVC已用容量和剩余可用容量的方法。 1 通过Prometheus查询     阅读全文
        
            posted @ 2025-10-29 14:17
singless233
阅读(6)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
1 介绍 目前人工智能火热,各种机器学习、训练,免不了要使用到gpu资源。本文主要介绍K8S环境下,如何让POD使用Node上的GPU资源。 K8S本身实现了设备插件(Device Plugin),让 Pod 可以访问类似 GPU 这类特殊的硬件功能特性。 2 确定显卡型号 服务器安装好显卡后,可以    阅读全文
        
            posted @ 2025-10-29 14:17
singless233
阅读(9)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
1 介绍 lldpd是IEEE802.1AB (LLDP)协议的一种实现。目标是帮助定位所有设备的邻居设备。例如可以定位服务器某个网卡是接在交换机的哪个接口上。要使用该协议交换机上需要启用lldp协议,linux服务器上需要安装lldp相关软件。 2 安装 apt install lldpd 安装后    阅读全文
        
            posted @ 2025-10-29 14:15
singless233
阅读(7)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
1 DCGM介绍 在前面给大家介绍了K8S环境下如何调度GPU,在显卡的实际应用中,监控是不可缺少的一环。通过监控,我们能更直观的了解到显卡的使用情况和各项监控指标。英伟达提供了DCGM (NVIDIA Data Center GPU Manager) 工具用于管理和监控集群环境中的N卡。 在K8S    阅读全文
        
            posted @ 2025-10-29 14:15
singless233
阅读(17)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
本文主要介绍如何通过一种简单方式来判断应用当前所在的运行环境。 1 物理机 物理机和虚拟机因为都是完整的操作系统。因此可以用dmidecode来检查计算机所在的环境。dmidecode是一个可以将DMI table中的内容以人类可读格式导出的工具。DMI (也被称为SMBIOS) Table中保存的    阅读全文
        
            posted @ 2025-10-29 14:14
singless233
阅读(235)
评论(0)
推荐(1)
        
        
            
        
        
摘要:        
1. RDMA介绍 1.1 什么是RDMA RDMA(Remote Direct Memory Access),全称远端内存直接访问技术,可以在使用极少CPU资源的情况下,将数据从一台服务器传输至另一台服务器。 在数据中心内部,大型分布式计算存储资源之间,如果使用传统的TCP/IP进行网络互连,将占    阅读全文
        
            posted @ 2025-10-29 14:13
singless233
阅读(10)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
ChatGPT的爆火带动了AIGC相关产业链的发展。也激发了大众研究探索AI的热情。本文主要介绍AI领域的一些基础概念及技术。 AI:人工智能 (artificial intelligence) 。属于计算机科学领域,致力于解决与人类智慧相关的常见认知问题,例如学习、创造和图像识别等。AI的目标是建    阅读全文
        
            posted @ 2025-10-29 14:12
singless233
阅读(11)
评论(0)
推荐(0)
        
        
            
        
        
摘要:        
1 基本概念 1 prometheus介绍 Prometheus 是一个开源的系统监控和报警工具,专为高效采集和存储时间序列数据而设计,目前广泛用于监控微服务架构、云基础设施和Kubernetes集群等环境。Prometheus的架构图如下。 exporter可以理解为prometheus的客户端,    阅读全文
        
            posted @ 2025-10-29 14:12
singless233
阅读(7)
评论(0)
推荐(0)
        
        
 
                    
                     
                    
                 
                    
                 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号