冷滟泽的个人博客冷滟泽的个人博客

CF123D String 【后缀数组+单调栈】

题意

枚举字符串 s 的每一个本质不同的子串 ss ,令 cnt(ss) 为子串 ss 在字符串 s 中出现的个数,求

\sum \frac{cnt(ss)\times [cnt(ss)+1]}{2}

思路

  • s 的后缀排序,求出 height 数组;
  • 每个后缀的每个前缀都是原字符串的一个子串
  • height 数组中连续不小于 k 的一段就包含了一些长度为 k 的重复子串;
  • 维护递增的单调栈统计答案。单调栈本身的意义是:栈内的每一个元素到当前元素为止,没有比它小的元素。将这一性质应用到后缀数组上,则表示这个元素的 height 就是这一段的最长公共前缀长度;
  • 可是这么做可能会重复统计答案。一个更长的公共前缀会被包含它的较短一些的公共前缀再次统计它的前若干个子串。所以我们真正统计的子串个数应该是: 当前元素LCP长度 - max(栈中下一个元素的LCP长度, 即将加入的元素的LCP长度)

代码

#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
const int MAXN=110000;
const int MAXS=256;
int n; char a[MAXN];
int sa[MAXN], rnk[2*MAXN], rnk1[2*MAXN];
int st[MAXS], cnt[MAXN], tmp[MAXN];
int height[MAXN], top;
struct Node
{
    int id, val;
    Node(int i=0, int v=0): id(i), val(v) {}
} sta[MAXN];
int main()
{
//  freopen("CF123D.in", "r", stdin);
//  freopen("CF123D.out", "w", stdout);
    scanf("%s", a+1); n=strlen(a+1);
    memset(st, 0, sizeof st);
    memset(rnk, 0, sizeof rnk);
    for (int i=1; i<=n; i++) st[a[i]]=1;
    for (int i=1; i<MAXS; i++) st[i]+=st[i-1];
    for (int i=1; i<=n; i++) rnk[i]=st[a[i]];
    for (int k=0, p=1; k<n&&p<=n; p<<=1)
    {
        memset(cnt, 0, sizeof cnt);
        for (int i=1; i<=n; i++) cnt[rnk[i+p]]++;
        for (int i=1; i<=n; i++) cnt[i]+=cnt[i-1];
        for (int i=n; i>=1; i--) tmp[cnt[rnk[i+p]]--]=i;
        memset(cnt, 0, sizeof cnt);
        for (int i=1; i<=n; i++) cnt[rnk[i]]++;
        for (int i=1; i<=n; i++) cnt[i]+=cnt[i-1];
        for (int i=n; i>=1; i--) sa[cnt[rnk[tmp[i]]]--]=tmp[i];
        memcpy(rnk1, rnk, sizeof rnk1);
        rnk[sa[1]]=k=1;
        for (int i=2; i<=n; i++)
        {
            if (rnk1[sa[i]]!=rnk1[sa[i-1]]||rnk1[sa[i]+p]!=rnk1[sa[i-1]+p])
                k++;
            rnk[sa[i]]=k;
        }
    }
    height[n+1]=0;
    for (int i=1, k=0; i<=n; i++)
    {
        if (rnk[i]==1)
        {
            height[rnk[i]]=k=0;
            continue;
        }
        if (--k<0) k=0;
        while (a[i+k]==a[sa[rnk[i]-1]+k]) k++;
        height[rnk[i]]=k;
    }
    long long ans=0;
    for (int i=1; i<=n; i++)
        ans+=n-sa[i]+1-max(height[i], height[i+1]);
    top=0;
    for (int i=1; i<=n+1; i++)
    {
        int t=i;
        while (top>0&&height[i]<sta[top-1].val)
        {
            int l=i-sta[--top].id+1;
            int k=sta[top].val-max(height[i], top>0?sta[top-1].val:0);
            ans+=1ll*l*(l+1)/2*k;
            t=min(t, sta[top].id);
        }
        if (top==0||height[i]>sta[top-1].val)
            sta[top++]=Node(t, height[i]);
    }
    cout<<ans<<endl;
    return 0;
}
未经允许不得转载:冷滟泽的个人博客 » CF123D String 【后缀数组+单调栈】

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址