BZOJ 1030(AC自动机+dp)

传送门

题面:

1030: [JSOI2007]文本生成器

Time Limit: 1 Sec  Memory Limit: 162 MB
Submit: 6094  Solved: 2580
[Submit][Status][Discuss]

Description

  JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,
他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文
章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,
那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的
标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6
生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

Input

  输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N (<= 60),GW文本生成器 v6生成的文本固
定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包
含英文大写字母A..Z

Output

  一个整数,表示可能的文章总数。只需要知道结果模10007的值。

Sample Input

2 2
A
B

Sample Output

100

题面分析:

    首先,多串匹配,我们不难想到用AC自动机去维护。

    不难发现,如果没有限制,一个长度为m的字符串最多可能构成 26^m种字符串。而如果加上限制条件,我们直接去算可行的方案就相当困难。但是我们发现,不可行的方案相对来说比较好求,只需要剔除完整的字符串的方案数即可。因此我们可以优先考虑西安求出不可行的方案数res,并用 26^m-res即为需要求的可行的结果。

    而对于不可行的方案数,我们可以用dp记录方案数去求解。我们设dp[i][j]为当前长度为i的字符串处于Trie树中的第j号结点所具有的方案数。

    根据AC自动机next数组的性质,我们不难发现,长度为i+1,位于第j个结点的方案数可以转移到长度为i,位于第next[j][k]结点的方案数,即dp[i+1][j]=dp[i+1][j]+dp[i][next[j][k]]。而当我们遍历到第j 个结点时发现它可以作为终止结点,我们就跳过该结点,此时就可以求出不符合条件(凑不出完整字符串)的方案数了。

代码:

#include <bits/stdc++.h>
#define maxn 105
using namespace std;
int dp[maxn][7000];
char s[500];
const int mod=10007;
int n,m;
struct Trie{
    int next[10000][26],fail[10000],End[10000],id,root;
    int newnode(){
        for(int i=0;i<26;i++){
            next[id][i]=-1;
        }
        End[id]=0;
        return id++;
    }
    void init(){
        id=0;
        root=newnode();
    }
    void Insert(char *str){
        int len=strlen(str);
        int now=root;
        for(int i=0;i<len;i++){
            if(next[now][str[i]-'A']==-1){
                next[now][str[i]-'A']=newnode();
            }
            now=next[now][str[i]-'A'];
        }
        End[now]=1;
    }
    void build(){
        queue<int>que;
        fail[root]=root;
        for(int i=0;i<26;i++){
            if(next[root][i]==-1){
                next[root][i]=root;
            }
            else{
                fail[next[root][i]]=root;
                que.push(next[root][i]);
            }
        }
        while(!que.empty()){
            int now=que.front();
            que.pop();
            for(int i=0;i<26;i++){
                if(next[now][i]==-1){
                    next[now][i]=next[fail[now]][i];
                }
                else{
                    fail[next[now][i]]=next[fail[now]][i];
                    que.push(next[now][i]);
                }
            }
            End[now]|=End[fail[now]];//终点标志也需要转移
        }
    }
}ac;
int powmod(int a,int n){
    int res=1;
    while(n){
        if(n&1) res=res*a%mod;
        a=a*a%mod;
        n>>=1;
    }
    return res;
}
void solve(){
    dp[0][0]=1;
    for(int i=1;i<=m;i++){
        for(int j=0;j<=ac.id;j++){
            if(ac.End[j]) continue;//如果当前位为某一个串的终点
            for(int k=0;k<26;k++){
                if(ac.End[ac.next[j][k]]) continue;
                dp[i][ac.next[j][k]]=(dp[i][ac.next[j][k]]+dp[i-1][j])%mod;
            }
        }
    }
    int res=0;
    for(int i=0;i<=ac.id;i++){
        res=(res+dp[m][i])%mod;
    }
    cout<<(powmod(26,m)-res+mod)%mod<<endl;
}
int main()
{
    scanf("%d%d",&n,&m);
    ac.init();
    while(n--){
        scanf("%s",s);
        ac.Insert(s);
    }
    ac.build();
    solve();
}

 

posted @ 2018-08-18 17:23  ChenJr  阅读(73)  评论(0编辑  收藏