天天看点

poj1743(后缀数组:最长不可重叠子串长度)

链接:http://poj.org/problem?id=1743

题意:

给你n个数字,挨个作差,求这n-1个数字的最长不可重叠子串长度。

思路:

罗大牛就是6。看了罗牛的后缀数组PDF。这道题是后缀数组的基础题,我们可以二分答案+判定。

如何判定?假设我们当前二分的答案是k,我们把后缀按字典序排序,同时按k分组,保证每一组内的所有的height值都>=k。这样,如果存在长度是k的子串,一定会出现在某个组内(或者多个组,存在即可)。我们找到每个组内的sa的最小值和最大值,如果他俩的差>=k就存在这样的解。

代码:

#include<cstdio>
#include<cstring>
#include<iostream>


#define maxn 20000

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
     int i,j,p,*x=wa,*y=wb,*t;
     for(i=0;i<m;i++) ws[i]=0;
     for(i=0;i<n;i++) ws[x[i]=r[i]]++;
     for(i=1;i<m;i++) ws[i]+=ws[i-1];
     for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
     for(j=1,p=1;p<n;j*=2,m=p)
     {
       for(p=0,i=n-j;i<n;i++) y[p++]=i;
       for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
       for(i=0;i<n;i++) wv[i]=x[y[i]];
       for(i=0;i<m;i++) ws[i]=0;
       for(i=0;i<n;i++) ws[wv[i]]++;
       for(i=1;i<m;i++) ws[i]+=ws[i-1];
       for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
       for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
       x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
     }
     return;
}
int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
     int i,j,k=0;
     for(i=1;i<=n;i++) rank[sa[i]]=i;
     for(i=0;i<n;height[rank[i++]]=k)
     for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
     return;
}

int check(int *sa,int n,int k)
{
    int min=sa[1],max=sa[1];
    for(int i=2;i<=n;i++)//height[1]无定义,因为height[i]是sa[i]和sa[i-1]的公共前缀长度
    {
        if(height[i]<k)
            max=min=sa[i];
        else
        {
            if(sa[i]<min)
                min=sa[i];
            if(sa[i]>max)
                max=sa[i];
            if(max-min>=k)
                return 1;
        }
    }
    return 0;
}

int main()
{
    freopen("in.txt","r",stdin);
    int r[maxn],sa[maxn];
    int n;
    while(scanf("%d",&n)!=EOF)
    {
        if(!n)
            break;
        n--;
        int num1;
        scanf("%d",&num1);
        for(int i=0;i<n;i++)
        {
            int temp;
            scanf("%d",&temp);
            r[i]=temp-num1+100;
            num1=temp;
        }
        r[n]=0;
        da(r,sa,n+1,200);
        calheight(r,sa,n);
        int min=1,max=n/2;
        while(min<=max)
        {
            int mid=(min+max)/2;
            if(check(sa,n,mid))
                min=mid+1;
            else
                max=mid-1;
        }
        if(max>=4)//没太懂为啥是4
            printf("%d\n",max+1);
        else
            printf("%d\n",0);
    }
    return 0;
}
           

<p><strong>链接:</strong></p><p><a target=_blank href="http://poj.org/problem?id=1743" target="_blank" rel="external nofollow" >http://poj.org/problem?id=1743</a></p><p></p><p><strong>题意:</strong></p><p>给你n个数字,挨个作差,求这n-1个数字的最长不可重叠子串长度。</p><p></p><p><strong>思路:</strong></p><p>罗大牛就是6。看了罗牛的后缀数组PDF。</p><p>这道题是后缀数组的基础题,我们可以二分答案+判定。</p><p>如何判定?假设我们当前二分的答案是k,我们把后缀按字典序排序,同时按k分组,保证每一组内的所有的height值都>=k。这样,如果存在长度是k的子串,一定会出现在某个组内(或者多个组,存在即可)。我们找到每个组内的sa的最小值和最大值,如果他俩的差>=k就存在这样的解。</p><p></p><p><strong>代码:</strong></p>

继续阅读