美文网首页信息学竞赛
字典树的思维拓展 - 最长公共前缀

字典树的思维拓展 - 最长公共前缀

作者: 戴文KeepLearning | 来源:发表于2021-12-04 10:23 被阅读0次

题目

蒜头君有 N 个字符串,他随机选两个字符串,问它们的最长公共前缀的期望是多少。
输入格式
第一个一个整数 N ,表示蒜头君有 N 个字符串。(2 \leq N \leq 10^6)
接下来 N 行,每行一个字符串,保证字符串仅由小写字母组成且总长度不超过 10^6
输出格式
输出一行,为最长公共前缀的期望,与标准输出相差 10^{-6} 以内均算通过。

解析

这道题目,我们可以运用我们刚学习的 字典树 数据结构的原理来解决这个问题。
第一步,建立一棵字典树,统计每个节点的经过次数 和 以它为结尾的字符串个数。
第二步,通过对字典树、还有最长公共前缀的分析,那么最长公共前缀到达该节点时,有以下三种情况:

  1. 任意不同去向的两个字符串。


    1.png
  2. 一个以当前点为结尾的字符串和一个有下一个点的字符串。


    2.png
  3. 两个同时以这个点为结尾的字符串。(点 up[u] 表示以该点结束的字符串数量,那么他们的组合数就是 C^2_{p[u]}=\frac{p[u]*(p[u]-1)}{2}
    分别统计这三种情况的组合数量,并乘上该点深度,可以得到这个点对总和的贡献。
    第三步,除以总的情况数 C^2_{N} = \frac {N * (N-1)}{2} 就可以了。

参考答案代码

#include<bits/stdc++.h>
using namespace std;
const int maxn = 1e6+1;
char s[maxn];
int tot, ch[maxn][26], cnt[maxn], p[maxn];
long long ans;
void insert(){
    int len = strlen(s), now = 0;
    for(int i=0;i<len;i++){
        if(ch[now][s[i]-'a']==0){
            ch[now][s[i]-'a']=++tot;
        }
        now = ch[now][s[i]-'a'];
        cnt[now]++;
    }
    p[now]++;
}
void dfs(int u, int step){  //利用深搜,求出所有点中的前缀数对于期望的贡献
    for(int i=0;i<26;i++){
        for(int j=i+1;j<26;j++){
            if(ch[u][i] && ch[u][j]){
                ans += step * cnt[ch[u][i]] * cnt[ch[u][j]]; //第一种情况
            }
        }
    }
    for(int i=0;i<26;i++){
        if(ch[u][i]){
            ans += step * p[u] * cnt[ch[u][i]]; //第二种情况
        }
    }
    ans += step * p[u] * (p[u] - 1) / 2; //第三种情况
    for(int i=0;i<26;i++){
        if(ch[u][i]){
            dfs(ch[u][i],step+1); //对点u的子节点进行深搜 
        }
    }
    return;
} 


int main(){
    long long N;
    cin >> N;
    for(long long i=0; i<N; i++){
        cin >> s;
        insert(); // 将新读入的字符串插入字符串
    }
    dfs(0,0); // 从 0 点开始,逐层向下去寻找最长的公共前缀
    cout << fixed << setprecision(10) << 1.0 * ans / (N*(N-1)/2); // 求期望
    return 0;
}

相关文章

网友评论

    本文标题:字典树的思维拓展 - 最长公共前缀

    本文链接:https://www.haomeiwen.com/subject/gieixrtx.html