QijMo

导航

[原创]关于垃圾短信检测的几点看法

看了玉开同学写的

谈谈互动型网站中垃圾贴的应对方案

我也谈谈我对手机短信的过滤想法。在我以前参与的发送短信项目中,出现过一天100W条的垃圾短信,后来经过逐步完善系统,成功限制在每天1W条以内。

短信发送机制:

在过去的几年中,好多站点都提供了免费发送手机短信功能,通过WEB站点直接将短信发送到用户手机上。实现过程都是通过和运营商合作,将短信通过CMPP(移动)协议提交到运营商短信网关。

垃圾短信分析:

1、由于垃圾短信也有一定的成本(就算网站有赠送免费发送,也有一定的免费量限制),再加上现在一般都有图片验证码,所以要进行机器人发送,一般不太容易实现。

所以发送垃圾短信一般是人工进行操作,比发贴的成本要高很多。

2、垃圾短信的接收者是手机用户,一般短信中都会留有联系方式(电话或手机),一般不会是电子邮件或QQ号。一个没有任何联系方式的垃圾短信意义不大。(这点很重要,我们也是发现有垃圾短信后1个多月才发现这个规律)

技术实现:

1、实现一个专门的垃圾短信检测系统,网站在用户点击发送时,将短信信息(包括发送者、发送内容、发送者IP、收信人)提交给短信检测系统进行检测,只有检测通过才真正将短信提交给后台发送的程序

2、下面列举主要的几个检测方面:

  一、短信内容:将短信内容全部转为ANSI,提取出中间的数字(包括像数字的字母,如O,l等),将数字进行组合,如果出现5个以上的数字,就将数据放入内存中,累计有5条以上短信出现同样的组合,后续同样组合的短信就检测不通过。

  二、发送者:限制发送者在每分钟、每小时、每天的发送量

  三、发送者IP:限制发送者IP在每分钟、每小时、每天的发送量

  4、发送重复内容:将所有发送的内容进行Hash并放入内存中,当发现1小时内同一个内容的短信达到一定值时,检测不通过。

 

这是几年前参与的项目,有些方面也记得不太清楚了,重点是抛砖引玉,共同讨论。谢谢

 

-----------------------

转发请保留出处

posted on 2010-07-16 18:57  V阿莫  阅读(2196)  评论(8编辑  收藏  举报