【四级事故】【VBS】payid字段超限导致无法填帐影响贷后和客服一线作业,字段扩位操作导致从库异常影响提现、授信和主动还款
问题原因:
扣款程序使用到的dbo.Received表中的字段PayID超过了定义int最大值
问题影响:
16:20 主流程提现业务恢复(14:10~16:20)
17:10 豆豆授信业务积压(13:50~15:03 15:13~17:00)
17:10 账单查询功能恢复(14:01~17:10)
18:10 主动还款,提前清贷功能恢复(14:10~18:10)
21:45还款填帐功能恢复 (13:20~21:45)
贷后管理部反馈:
1.18日贷后坐席查询扣款结果异常(13:20~21:00)
2.18日贷后坐席查询账单异常,无法开展正常催收作业(组织内部培训)(14:01~18:17)
3.18日T流入率有上升
4.19日贷后坐席加班追赶催收进度
客户服务部反馈:
1.18日填帐异常,客户进线激增并积压
2.18日客服坐席无法查询客户账单(14:01~18:39)
3.19日加班处理回复客户
现场解决措施:
1、先直接在表上扩展字段 ,预估1个小时 :
2、先删除索引, 扩字段期间会影响数据的读写
3、排查原因为同步扩位事务和生产事务同步执行导致从库压力过大导致 ,影响从库读业务 要求回滚,领导坚持 不回滚继续扩充字段
4、扩字段失败
5、换修改程序,id改成负数存储。 过程 18个小时
6、接下来用表替换法4天完成整体的字段扩充。
后续优化措施:
1. 整理信贷所有数据库隐患并整改
大表隐患
主键数值类型和外键数值类型隐患(核心表)
2. 完善内部质量管理
设计阶段重点关注点宣导及完善设计方案评审规范,
数据库原理培训,计划6.28完成
主流程依赖项梳理并排查风险点
3. 制定故障处理中确定指挥人流程和故障上报内容模板(上报内容规范化,标准化) 完成时间:2024.6.14
4. 自增主键监控
5. 完善数据库变更规范,与研发讨论并确认,完成后做好全员宣贯
事故标签:四级事故
事故划分依据:
由于VBS库中Received表payid字段超限导致扣款后无法填帐,且由于DBA评估字段扩位存在错误,在处理过程中引发了新的问题。产生的影响有:在13:20~21:00之间影响贷后催收作业,共7小时40分钟;在14:10~16:20之间影响提现业务,共2小时10分钟;在13:50~17:00之间影响授信业务,共3小时10分钟;在14:10~18:10之间影响还款业务,共4小时;在14:01~18:39之间影响客服业务,共4小时38分。经复盘,根据系统事故条例,根据影响核心业务最长时间达7小时40分钟,认定为四级事故,责任科室为信贷研发室,基础架构室
事故分析:
数据库设计过程类型需要重点评估,特别是自增长用int。