ceph集群PG数具体计算过程（我们有七个osd）

通过你的命令 ceph osd pool ls detail | grep pg_num，各池的 pg_num 如下：

存储池名称	pg_num	副本数（size）	实际 PG 副本数（pg_num × size）
.mgr	1	3	3
cephfs_data	32	3	96
cephfs_metadata	32	3	96
.rgw.root	32	3	96
default.rgw.log	32	3	96
default.rgw.control	32	3	96
default.rgw.meta	32	3	96
default.rgw.buckets.index	32	3	96
default.rgw.buckets.non-ec	32	3	96
default.rgw.buckets.data	256	3	768

你尝试创建新池 yinzhengjie-k8s 时指定 pg_num=128，这会新增 128 × 3（副本数）= 384 个 PG 副本。
新增后的总 PG 副本数 = 1539 + 384 = 1923 → 每个 OSD 需要承载 1923 ÷ 7 ≈ 274.71 个 PG，超过了默认的 mon_max_pg_per_osd=250 限制。

允许单个 OSD 承载更多 PG（需谨慎，可能影响性能）：

ceph config set mon mon_max_pg_per_osd 300

然后重新创建池：

ceph osd pool create yinzhengjie-k8s 128 128

减少部分高 pg_num 池的 PG 数量（例如 default.rgw.buckets.data 的 pg_num=256 过高）：

# 调整该池的 pg_num 到合理值（例如 64）
ceph osd pool set default.rgw.buckets.data pg_num 64
ceph osd pool set default.rgw.buckets.data pgp_num 64

调整后：

让 Ceph 自动优化 PG 数量：

# 对所有池启用自动缩放
ceph config set global osd_pool_default_pg_autoscale_mode on

Ceph 将根据数据量自动调整 PG 数，避免手动计算。

添加更多 OSD 节点以分担 PG 负载（最根本的解决方案）。

建议顺序：先启用自动缩放 → 扩展 OSD → 必要时临时调高 PG 限制。

posted on 2025-03-02 18:52 Leo-Yide 阅读(320) 评论(0) 收藏举报