后缀数组的一些技巧

}一般的,我们在字符串最后补个0,使排名从1开始。

后缀数组技巧:

.对于可重复的最长重复子串问题,可以直接遍历height[1..n],易知排名相邻的字符串最相似。

.对于不可重复的最长重复子串问题,可以二分答案,遍历height[1..n]分组:

每组大于mid,若碰到一个小于mid的更新。

判断这一组中的max(sa[i])-min(sa[i])是否大于等mid

这意味着两个距离大于mid,且存在公共子串长于mid。重新开始一轮。

有希望成为最长公共前缀不小于 k 的两个后缀一定在同一组.所以可以nlogn求出。

.对于求一个字符串子串的个数(两两不同)

可根据后缀数组的定义,求出以每个排名下标位置开头的数目:n-sa[i]-height[i];

所以若求子串排名,可以二分答案,找到相应位置,

若求出现的最前位置{

往后排名找,若有height>答案串长度,

可更新试探解,否则Break,这就必定有一个字符不等了

}HDU5008

④(个人理解):后缀数组的sa[i-1]的后缀和sa[i]的后缀在另外一种含义上是:最相似的子串,相邻两个串相似度不够,之后的就更不行了,这种思想可以用来解释技巧2中分组的原因。

posted @ 2017-05-31 14:19  QYP_2002  阅读(356)  评论(4编辑  收藏  举报