自动增长配置不合理导致的性能抖动

背景

客户收到了SQL专家云告警邮件,在凌晨2点到3点之间带有资源等待的会话数暴增,请我们协助分析。

现象

 登录SQL专家云,进入活动会话的趋势分析页面,下钻到2点钟一个小时内的数据,看到每分钟的等待数都在100左右,2点15分时达到200。

转到活动会话原始数据页面,看到大量会话都在等待,等待类型是LATCH_EX,等待资源是LOG_MANAGER,数据库都是MIIS****。SQL语句是INSERT、UPDATE、DELETE等写入的语句。

 等待资源是LOG_MANAGER,说明数据库MIIS****的日志文件在发生变化。转到数据库空间页面,发现日志文件从2点钟开始增长,2点20时增长到90GB,3点时降到初始值(因为3点有自动收缩日志文件的计划任务)。

分析

首先要分析的是什么语句导致数据库日志文件的暴增。进入慢语句汇总页面,汇总2点钟一个小时内的慢语句, 根据执行时间、CPU消耗、读次数、写次数等指标排序, 找到一个非常大的SQL语句,2点开始执行,2点18分结束。这是迁移历史数据的作业,把当前时间一年前数据迁移到历史表(插入到历史表,然后从当前表中删除),作业很久以前被停止了,昨天才开启,因为要迁移的数据很多,导致了日志文件的暴增。

接下来分析LOG_MANAGER的等待,日志文件空间不够时就会触发自动增长,文件增长时,写入数据的会话必须等待,此时会看到Latch等待类型,增长花费的时间越长,等待的时间越长,造成的性能抖动越严重。

从2点钟开始日志文件频繁自动增长,日志文件的自动增长增量设置为10%,随着日志文件的空间越来越大,每次增加会达到几GB甚至更多,基于磁盘的性能,最少造成十几秒的性能抖动。

解决

  1. 修改数据文件和日志文件的自动增长为200MB。  每次自动增长很快就能完成,基本不会有性能抖动。
  2. 调整自动收缩日志文件的维护计划,每次收缩的时候预留10GB的空间,避免频繁的自动增长。
  3. 定期检查数据文件的空间,一次性增长一定的空间,避免频繁的自动增长。

其它

除非磁盘空间严重不足,否则不要收缩数据文件,详细请参考:数据库自动收缩造成的阻塞

posted @ 2023-01-05 21:07  格瑞趋势技术团队  阅读(349)  评论(0编辑  收藏  举报