美文网首页
AC自动机_多组字符串匹配

AC自动机_多组字符串匹配

作者: Gitfan | 来源:发表于2017-03-05 18:25 被阅读0次

    病毒侵袭

    #include<cstdio>
    #include<cstring>
    #include<queue>
    #include<algorithm>
    using namespace std;
    const int MAXN=4000010;
    int arr[5];
    struct Node
    {
        int id;
        int curr;
        Node *fail;
        Node *next[128];
        void init()
        {
            id=0;
            curr=0;
            fail=NULL;
            memset(next,NULL,sizeof(next));
        }
    };
    Node *root;
    void insert(char *str,int id)
    {
        Node *p=root;
        int len=strlen(str);
        for(int i=0;i<len;i++)
        {
            int pos=str[i];
            if(p->next[pos]==NULL)
            {
                p->next[pos]=new Node();
                p->next[pos]->init();
                p=p->next[pos];
            }
            else p=p->next[pos];
        }
        p->id=id;
    }
    void getFail()
    {
        Node *temp,*son,*p=root;
        queue<Node *> que;
        que.push(p);
        while(!que.empty())
        {
            Node *curr=que.front();
            que.pop();
            for(int i=0;i<128;i++)
            {
                son=curr->next[i];
                if(son!=NULL)
                {
                    if(curr==root) son->fail=root;
                    else
                    {
                        temp=curr->fail;
                        while(temp!=NULL)
                        {
                            if(temp->next[i]!=NULL)
                            {
                                son->fail=temp->next[i];
                                break;
                            }
                            temp=temp->fail;
                        }
                        if(temp==NULL) son->fail=root;
                    }
                    que.push(son);
                }
            }
        }
    }
    bool query(char *str,int curr)
    {
        int len=strlen(str);
        Node *temp,*p=root;
        bool flag=false;
        int index=0;
        for(int i=0;i<len;i++)
        {
            int pos=str[i];
            while(p->next[pos]==NULL&&p!=root) p=p->fail;
            p=p->next[pos];
            if(p==NULL) p=root;
            temp=p;
            while(temp!=root)
            {
                if(temp->id>0&&temp->curr!=curr)
                {
                    flag=true;
                    temp->curr=curr;
                    arr[index++]=temp->id;
                    if(index>=3) break;
                }
                else break;
                temp=temp->fail;
            }
            if(index>=3) break;
        }
        if(flag)
        {
                sort(arr,arr+index);
                printf("web %d:",curr);
                for(int j=0;j<index;j++)
                    printf(" %d",arr[j]);
                printf("\n");
                return true;
        }
        return false;
    }
    int main()
    {
        char virus[205];
        char web[10010];
        root=new Node();
        root->init();
        int n,m,total=0;
        scanf("%d",&n);
        for(int i=0;i<n;i++)
        {
            scanf("%s",virus);
            insert(virus,i+1);
        }
        getFail();
        scanf("%d",&m);
        for(int i=0;i<m;i++)
        {
            scanf("%s",web);
            if(query(web,i+1))
            {
                total++;
            }
        }
        printf("total: %d\n",total);
        return 0;
    }
    

    相关文章

      网友评论

          本文标题:AC自动机_多组字符串匹配

          本文链接:https://www.haomeiwen.com/subject/bveegttx.html