中文反垃圾邮件过滤系统的开发与研究
中文反垃圾邮件过滤系统的开发与研究
【摘要】:随着网络的广泛应用,电子邮件作为一种全新的通信工具是互联网应用的一个成功典范。与传统邮件相比,它诞生时间不长,却给人们的工作、生活等诸多方面带来了深刻的影响,然社会和政治等垃圾邮件的日益增加已成为电子邮件使用者所面临的头痛问题。实际上,今天垃圾邮件的数量已经大大超过了对我们有用的正常邮件,浪费大量的人力物力。 近年来,垃圾邮件问题已引起了国内外的高度重视,各国都在采取相应的措施减少垃圾邮件的危害和影响。 目前国内反垃圾邮件过滤系统主要果用了利用垃圾邮件本身规律的规则过滤技术,而内容过滤技术还不成熟,因此对中文垃圾邮件的过滤效果还不够理想。为了更好地过滤垃圾邮件,我们展开了中文反垃圾邮件过滤系统的开发与研究。木文在对电子邮件原理和垃圾邮件的过滤方法进行分析研究的基础上提出并实现了一套垃圾邮件过滤的解决方案。这套方案将利用垃圾邮件规律的规则过滤和最小风险的Naive Bayes内容过滤算法结合了起来,并根据垃圾邮件的特性做了必要的改进。这套方案在Linux/Solaris系统平台上完成了测试版本的软件编程,并且在一些单位的电子邮件服务器上进行试运行和测试。测试结果显示,基于该方案的软件实现取得了较好的过滤效果。
【关键词】:垃圾邮件 规则过滤 Naive Bayes
【学位授予单位】:中国科学院研究生院(西安光学精密机械研究所)
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.098
【DOI】:CNKI:CDMD:2.2006.023609
【学位授予单位】:中国科学院研究生院(西安光学精密机械研究所)
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.098
【DOI】:CNKI:CDMD:2.2006.023609
链接:http://cdmd.cnki.com.cn/Article/CDMD-80142-2006023609.htm
浙公网安备 33010602011771号