【四级事故】路由决策费率问题

问题原因

路由与费率决策交互频繁,风控系统优化处理效率,路由针对调用费率决策由串行改为并行。并行处理中,忽略了一个局部变量在多线程中的安全性问题,导致多资方的费率区间映射错乱,最终导致费率决策回吐年化错误。

问题影响:

8月4日21:10 - 8月5日11:20 间隙性影响流程,对客年化可能会导致错误。

错误示例:

1、36资方按照24放款异常订单
8月05日,根据产品初选提供的订单9321笔,按资方利率收款利率、放款时间排除订单统计405笔,278W,预估损失约9.5W;
8月17日,产品部新提供文件2784笔,根据资方+用户利率区间计算(含资方/用户可收24~36,收24算定损),订单数2537笔,2143W,预估损失94.87W。

2、24资方按照36放款异常订单
涉及放款单数(金额):小贷63笔(70W) + 其他资方55笔(24W) =118笔(73W),现118笔都已修复。

3、问题订单范围描述
2022-08-04 20:20 – 2022-08-05 11:20,定损订单数:2537
预审成功数:7763 比例:32.68%
放款数据:6097 比例:41.61%
放款成功数:5854 比例:43.34%

涉及资方路由表和字段说明:
表名:fund.t_decision_rate_param,
字段名: really_monthly_rate(实际月利率),pre_decision_rate_range(费率预决策出的费率区间

后续优化措施:

1. 梳理费率处理路径,节点测试案例增加费率值验证,增加不同的排除费率资方进行验证 

2. 强化技术优化类 项目的技术影响范围评估和系统分析,强化技术评审 ,严格按照测试流程实施,具体内容可见规范1.3 常规测试流程关键节点和产出物 如下面附件截图部分。做好开发和测试的接力工作 

3. 技术优化类项目,测试需做详细的测试影响分析和场景分析,从用户场景进行测试而不是仅从开发改动点进行测试 

事故标签:四级事故

事故划分依据:

本次问题影响资损超过50万,小于100万,根据质量管理办法,认定为四级事故,主要责任为测试部某某,次要责任为研发部某某

事故分析:

从单线程优化到多线程特别要注意线程安全问题和线程资源管理的问题,不然很容易产生优化引发的新问题。测试需要对此类优化做多线程场景的测试。

posted @ 2025-03-03 10:56  无味之水  阅读(6)  评论(0)    收藏  举报