美文网首页
AC自动机_模板

AC自动机_模板

作者: Gitfan | 来源:发表于2017-03-05 16:30 被阅读0次

AC自动机:

  • 求多个字符串是否在主串中出现过。可依据情况分别求出出现次数,出现位置等。

AC自动机入门
Keywords Search
指针多叉树

#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
using namespace std;
const int MAXN=4000010;
const int BASE=26;
struct Node
{
    Node *fail;
    Node *next[26];
    int cnt;
    void init()
    {
        fail=NULL;
        memset(next,NULL,sizeof(next));
        cnt=0;
    }
};
Node *root;
void put(char *str)
{
    Node *p=root;
    int len=strlen(str);
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        if(p->next[pos]==NULL)
        {
            p->next[pos]=new Node();
            p->next[pos]->init();
            p=p->next[pos];
        }
        else p=p->next[pos];
    }
    p->cnt++;//题目含有重复模式串
}
void getFail()
{
    queue<Node *>que;
    Node *temp,*son,*p=root;
    que.push(p);
    while(!que.empty())
    {
        Node *curr=que.front();
        que.pop();
        for(int i=0;i<26;i++)
        {
            son=curr->next[i];
            if(son!=NULL)
            {
                if(curr==root)
                {
                    son->fail=root;
                }
                else
                {
                    p=curr->fail;
                    while(p!=NULL)
                    {
                        if(p->next[i]!=NULL)
                        {
                            son->fail=p->next[i];
                            break;
                        }
                        p=p->fail;
                    }
                    if(p==NULL) son->fail=root;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int len=strlen(str);
    Node *p=root,*temp;
    int sum=0;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        while(p->next[pos]==NULL&&p!=root) p=p->fail;
        p=p->next[pos];
        if(p==NULL) p=root;
        temp=p;
        while(temp!=root)
        {
            if(temp->cnt>=0)//这里直接把没访问过的节点设置为访问状态,加速搜索(因为题目求的是出现过的模式串,只求一次)
            {
                sum+=temp->cnt;
                temp->cnt=-1;
            }
            else break;//节点已经访问过了,直接break 
            temp=temp->fail;
        }
    }
    printf("%d\n",sum);
}
int main()
{
    char str[1000000+100];
    int cas,n;
    scanf("%d",&cas);
    while(cas--)
    {
        root=new Node();
        root->init();
        scanf("%d",&n);
        int i;
        getchar();
        for(i=0;i<n;i++)
        {
            gets(str);
            put(str);
        }
        getFail();
        gets(str);
        query(str);
    }
    return 0;
}

数组多叉树

#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
using namespace std;
const int MAXN=4000010;
const int BASE=26;
struct Node
{
    int cnt;
    int fail;
    int next[26];
};
Node trie[MAXN];
int trie_s;
void insert(char *str)
{
    int len=strlen(str);
    int p=1;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        if(!trie[p].next[pos])
        {
            trie[p].next[pos]=++trie_s;
            memset(trie[trie[p].next[pos]].next,0,sizeof(trie[trie[p].next[pos]].next));
            trie[trie[p].next[pos]].cnt=0;
            trie[trie[p].next[pos]].fail=0;
        }
        p=trie[p].next[pos];
    }
    trie[p].cnt++;
}
void getFail()
{
    queue<int> que;
    int son,p=1,temp;
    que.push(p);
    while(!que.empty())
    {
        int curr=que.front();
        que.pop();
        for(int i=0;i<26;i++)
        {
            son=trie[curr].next[i];
            if(son)
            {
                if(curr==1) trie[son].fail=1;
                else
                {
                    temp=trie[curr].fail;
                    while(temp!=0)
                    {
                        if(trie[temp].next[i])
                        {
                            trie[son].fail=trie[temp].next[i];
                            break;
                        }
                        temp=trie[temp].fail;
                    }
                    if(temp==0) trie[son].fail=1;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int cnt=0;
    int len=strlen(str);
    int p=1,temp;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'a';
        while(!trie[p].next[pos]&&p!=1) p=trie[p].fail;
        p=trie[p].next[pos];
        if(!p) p=1;
        temp=p;
        while(temp!=1)
        {
            if(trie[temp].cnt>=0)//
            {
                cnt+=trie[temp].cnt;
                trie[temp].cnt=-1;
            }
            else break;
            temp=trie[temp].fail;
        }
    }
    printf("%d\n",cnt);
}
int main()
{
    char str[1000000+100];
    int cas,n;
    scanf("%d",&cas);
    while(cas--)
    {
        trie_s=1;
        trie[1].cnt=0;
        trie[1].fail=0;
        memset(trie[1].next,0,sizeof(trie[1].next));
        scanf("%d",&n);
        int i;
        getchar();
        for(i=0;i<n;i++)
        {
            gets(str);
            insert(str);
        }
        getFail();
        gets(str);
        query(str);
    }
    return 0;
}

病毒侵袭持续中
指针多叉树

#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int MAXN=1010;
char virus[MAXN][55];
int num[MAXN];
struct Node
{
    Node *fail;
    Node *next[28];
    int id;
    void init()
    {
        id=-1;
        fail=NULL;
        memset(next,NULL,sizeof(next));
    }
};
Node *root;
void insert(char *str,int id)
{
    int len=strlen(str);
    Node *p=root;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'A';
        if(p->next[pos]==NULL)
        {
            p->next[pos]=new Node();
            p->next[pos]->init();
        }
        p=p->next[pos];
    }
    p->id=id;
}
void getFail()
{
    Node *temp,*son,*p=root;
    queue<Node *> que;
    que.push(p);
    while(!que.empty())
    {
        Node *curr=que.front();
        que.pop();
        for(int i=0;i<28;i++ )
        {
            son=curr->next[i];
            if(son!=NULL)
            {
                if(curr==root) son->fail=root;
                else
                {
                    temp=curr->fail;
                    while(temp!=NULL)
                    {
                        if(temp->next[i]!=NULL)
                        {
                            son->fail=temp->next[i];
                            break;
                        }
                        temp=temp->fail;
                    }
                    if(temp==NULL) son->fail=root;
                }
                que.push(son);
            }
        }
    }
}
void query(char *str)
{
    int len=strlen(str);
    Node *p=root,*temp;
    for(int i=0;i<len;i++)
    {
        int pos=str[i]-'A';
        if(pos<0||pos>26) pos=27;
        while((p->next[pos]==NULL)&&p!=root) p=p->fail;
        p=p->next[pos];
        if(p==NULL) p=root;
        temp=p;
        while(temp!=root)
        {
            if(temp->id!=-1)//这里只查询是病毒尾的节点;
            {
                num[temp->id]++;
            }
            temp=temp->fail;
        }
    }
}
int main()
{
    char str[2000000+100];
    int n;
    while(scanf("%d",&n)!=EOF)
    {
        root=new Node();
        root->init();
        for(int i=1;i<=n;i++)
        {
            scanf("%s",virus[i]);
            insert(virus[i],i);
            num[i]=0;
        }
        getFail();
        getchar();
        gets(str);
        query(str);
        for(int i=1;i<=n;i++)
        {
            if(num[i]) printf("%s: %d\n",virus[i],num[i]);
        }
    }
    return 0;
}

数组多叉树
填坑,待补充
填坑,待补充
填坑,待补充

相关文章

  • AC自动机 专题整理

    AC自动机学习记录 参考资料 字典树(讲解+模版)AC自动机算法AC自动机算法详解hdu 2222 ac自动机入门...

  • AC自动机_模板

    AC自动机: 求多个字符串是否在主串中出现过。可依据情况分别求出出现次数,出现位置等。 AC自动机入门Keywor...

  • 自动AC机?不,是AC自动机

    今天我们来介绍一点进阶的知识——AC自动机。 AC自动机是啥 AC自动机是什么呢?是不是用了这个算法,不管什么题目...

  • 【AC自动机】AC自动机可以帮你自动AC吗

    参考博文:AC自动机算法详解 (转载) (原文作者:DarkRaven,原文的链接失效了)图片来源:AC自动机算...

  • AC自动机

    AC自动机(Aho-Corasick\ automaton),可以解决多模板串匹配的问题。可以理解为可以一次性匹配...

  • AC自动机-去除敏感字符

    AC自动机 AC自动机:Aho-Corasick automation,该算法在1975年产生于贝尔实验室,是著名...

  • lucene中文分词

    IK中文分词 DoubleArrayTrie的AC自动机

  • 【CUC集训】kmp+AC自动机题解

    制作:邓楚盟 日期:2018年8月28日 A AC自动机模板题,注意是统计包含哪些单词,不是统计总得出现次数 B ...

  • 字符串算法小结

    hash kmp和ac自动机 后缀数组,后缀自动机,后缀树 扩展kmp manacher算法 回文自动机 可删改的...

  • AC 自动机

    AC自动机 AC自动机是一个经典的多模式串匹配算法,它可以实现对主串的一次扫描来匹配多个模式串的功能。实现AC自动...

网友评论

      本文标题:AC自动机_模板

      本文链接:https://www.haomeiwen.com/subject/vwlegttx.html