分享改进高性能通用分表归档存储过程测试结果更新

2011-12-14 13:00 熬夜的虫子阅读(928) 评论(0) 收藏举报

因高层突然变卦要以存储过程来完成订单的拆分归档工作所以虫子的同步工具先暂时搁置一段时间。

详细设计参考原理篇

更新一下测试结果旧的测试结果放在下面前一篇关于限制性开源的文章先删除因为是企业在用项目所以不开放性公布源码了有需要交流的同学可以单独联系虫子

更新内容

　　解决了一些bug，例如以前按一级表、二级表、三级表...的顺序删除，结果导致一级表删除后，二级表的数据读取错误。

　　优化了过程安全，在3个阶段进行临时表和游标资源的check。降低预料外异常对程序的影响。

　　改变删除的设计。

　　总的来说不是从性能上更新，而是从业务角度保证数据的完整性

最新测试结果

　500条

1000条

3000条

5000条

旧的测试结果

先晒下性能测试环境总共33张表数据量如下

归档表初始化

先看批次500条的性能

看看运行时间

2.342秒！！！！！

看看我们插入了的数据是否准确

OK源表的数据是500 或许大家对这组数据不以为然但是你要明白在33张特大表中进行的操作并且之间层级关联各种安全容错处理

再清除一下试试5000条

70秒有木有有木有比预想的性能要差一些因为5000条所涵盖的事务太大

数据还是很完美

总的来说这样的性能对于这样的应用场景应该没有多少老大会不满意了

先简单阐述一下概要详细查看原理篇

源表：一般是指同步归档等的主表 demo中以订单头表为例

一级表：以源表为关联表的数据表

二级表：以一级表为关联表的数据表

...

异常表：容错处理用来存放异常数据如果当期批次出错则将本次批次源表关联键信息入库下一批次则过滤这些数据再执行

减少IO的操作次数用游标循环源表来关联一级表二级表等是很错误的方案

理清层级关系源表过滤数据副本化如果一级表关联的操作次数比较多那么可以模仿源表操作以临时表取代物理表如果表关联的操作次数不多可以直接生成数据过滤池

刷新页面返回顶部

熬夜的虫子