yuan-er

导航

 

ALM-5101340 Ops巡检-系统库大小占用异常

告警解释

此告警对应指标“系统库大小占用”超出配置阈值,此指标反映系统库占用磁盘空间大小。

告警属性

告警ID

告警级别

告警类型

告警归属

业务类型

是否可自动清除

5101340

巡检配置

业务质量告警

租户面

云数据库 GaussDB 节点

告警参数

类别

参数名称

参数含义

定位信息

云服务

产生告警的云服务

实例ID

产生告警的实例ID

节点ID

产生告警的节点ID

巡检名称

产生告警的巡检名称

指标编码

产生告警的指标编码

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

租户ID

产生告警的租户ID

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

节点角色

产生告警节点的节点角色

指标编码

产生告警节点的指标编码

指标采集值

产生告警节点的指标采集值

指标阈值

产生告警节点的指标阈值

对系统的影响

系统库占用磁盘空间过大,在磁盘空间一定的情况下,用户库能够使用的磁盘空间会减少。

可能原因

  • 存储运维相关的系统表和视图占用磁盘空间。
  • 误在系统库下创建非系统表。

处理步骤

  1. 收到告警后,首先查看监控指标查看指标“系统库大小占用”,确认指标情况以及触发告警的组件。
  2. 登录实例节点登录系统库,执行如下命令,确认系统库下表占用磁盘空间的情况。

     

    SELECT schemaname,relname, pg_table_size(concat(schemaname,'.',relname))/1024/1024/1024 table_size_GB FROM PG_STAT_USER_TABLES ORDER BY table_size_gb DESC;
     
     
    
    

    • 查询结果中包含schemaname为非snapshot的记录,可能是用户误在系统库下创建表。

      优先联系技术支持确认是否为数据库自建的表。

      • 是,无法删除;
      • 否,可以联系建表人,是否可以删除,使用用户库建表。
    • 查询结果中schemaname均为snapshot,可以通过调整快照的保存和生成时间进行优化,但是调大获取快照间隔和调小保存时间,会影响运维的时效性,建议调整前请联系技术支持协助评估。
    • table_size_gb:表占用的磁盘空间。
    • wdr_snapshot_interval:获取快照操作的时间间隔,默认60分钟。
    • wdr_snapshot_retention_days:系统中数据库监控快照数据的保留天数,默认8天。

     

  3. 如果上述方法无法解决,联系技术支持进行处理。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

posted on 2024-10-23 15:18  数据库笔记  阅读(2)  评论(0)    收藏  举报