2013年11月20日

Aho-Corasick 多模式匹配算法、AC自动机详解

摘要: Aho-Corasick算法是多模式匹配中的经典算法,目前在实际应用中较多。Aho-Corasick算法对应的数据结构是Aho-Corasick自动机,简称AC自动机。搞编程的一般都应该知道自动机FA吧,具体细分为:确定性有限状态自动机(DFA)和非确定性有限状态自动机NFA。普通的自动机不能进行多模式匹配,AC自动机增加了失败转移,转移到已经输入成功的文本的后缀,来实现。1.多模式匹配 多模式匹配就是有多个模式串P1,P2,P3...,Pm,求出所有这些模式串在连续文本T1....n中的所有可能出现的位置。 例如:求出模式集合{"nihao","hao" 阅读全文

posted @ 2013-11-20 14:25 旭东的博客 阅读(42603) 评论(3) 推荐(5)

导航