背景:

这两天看了重温了下设计模式和数据结构,又补了下基础知识,然后就失眠了一整夜,不知为啥就想到级联及伪删数据这个问题。

由于级联删除是几乎人人都会遇到的问题,但方案却有限却不美好,所以欢迎大伙集思文益,以下内容欢迎大伙一起讨论。

级联删除的方式:

方式1:数据库设定级联:

常规MSSQL、MySql、Oracle都对设定了主外键关系的表提供级联删除。

优点:数据准确、使用方便,数据库设计之初就设定好。

缺点:

1:增加对增删改时外键检测的额外开销。

2:潜在危险系素大(如:删除部门或角色,发现一级联递归,整个系统的数据没了)。

3:不方便触发其它事件。

4:开发人员可能被屏蔽细节。

总体描述:适合小系统、小局部、无缓存状态的情况使用。

总体总结:很少使用。

方式2:触发器处理。

优点:DBA喜欢。

缺点:程序员不喜欢,很容易蒙B。

总体描述:适合系统负责人偏DBA爱好的场景,及业务无缓存场景。

总体总结:内部业务系统使用多、外部系统使用少。

方式3:业务代码控制

优点:程序员喜欢,自由控制度大。

缺点:程序员喜欢,自由控制度大(随着业务扩展,需要到处补代码)。

总体描述:爱自由,爱生活,爱写代码。

总体总结:常规方式,在所有系统使用都很广泛。

在方式3的基础上思考:如何在架构设计统一处理,减少代码的分布?

下面聊聊复杂度更高的伪删除问题:

触发器删除及伪删除

1:触发器方式

优点:

1:通过触发器删除,并将旧数据移到其它库或表。

2:数据干净,表压力小。

3:代码业务逻辑简单化。

4:DBA喜欢。

5:一手开发人员也喜欢。

缺点:

1:不好控制触发其它外部业务或事件(如在删的同时清文件等,但办法总比困难多)。

2:整体数据库压力大(这个还得看业务情况)。

3:级联的缓存不好控制(和写触发器的同步清楚业务还是可以控制)。

4:二接手维护的人员不喜欢。

总体描述:总体缺点不太明显,后期维护不便。

总体总结:业务系统用的相对较多。

2:伪删方式

优点:

1:数据只是标识状态,数据恢复容易。

2:开发人员喜欢。

缺点:

1:需要在系统各表增加版本号或IsDeleted等标识。

2:业务查询都需要增加过滤条件。

3:需要级联更新标识符号。

4:存在脏数据。

5:缓存需要全面控制。

总体描述:优点不太明显,缺点是业务代码分布复杂了。

总体总结:总体使用并不多。

扩展内容:

1:昨晚无意扫到了吉日一篇文章2010写的文章,大意是:

花一个星期增加伪删deletemark字段,改遍了所有业务代码。(评论主要偏触发器方案,及致人身攻击,6年过去了,相信那些人现在应该能淡定看问题了,地址就不贴了。)

2:对于增加字段带来的问题,有人说用视图处理。

3:另外看到一个有趣的场景:伪删后添加相同数据的问题。

增加IsDeleted字段后,把原来的【唯一键+IsDeleted】建立联合主键。

删除后:cyq 0。

新增加:cyq 1。

发现这时候就没法再删了,再删就两个cyq 0 冲突了,你会怎么解决

在互联网上搜伪删除相关的内容并不多,可以预见该方案的使用并没有普及,原因可能也在于没有从架构上能统一处理的方案出现。

思考:如何在架构设计上统一处理,减少业务代码?

博客园的级联反应是?

假设博客园要删除或禁用一个用户,分析需要处理多少事情?

1:几乎系统所有表都要关联处理(文章,评论,点赞,积分,闪存,招聘,博客、知识库、收藏、新闻等....)

PS:文件、图片(考虑到文件或图片外部站大量有引用,不处理。)

2:若缓存需要时时失效(这几乎是导致整站式缓存瞬间失效,系统要崩了......好在园子目前缓存没有时效性要求。)

那么问题来了:

1:园子是全处理了,还只是局部处理呢?

全处理:工作量有点大,代码分布有点散,随着业务增加,还得补充逻辑代码。

不处理:到处留下的用户链接导致的404,会不会影响SEO呢?

2:用户在博问上被采纳的内容呢?删呢?还是不删呢?

3:园子目前是采用真删呢还是伪删呢?

 

总结:

1:以前都是自己静静思考完,把功能在V5框架里实现了再分享。

2:现在,分享问题,讨论后后,再确定总体思路。

3:你参与过的项目,现在是用什么方案呢?觉的方案有改进的空间?

posted on 2016-07-25 14:59  路过秋天  阅读(9194)  评论(35编辑  收藏  举报
路过秋天