天天看点

用字符串哈希方法解决字符串匹配问题

题目和题解如下。

给定一个模式串 S,以及一个模板串 P,所有字符串中只包含大小写英文字母以及阿拉伯数字。

模板串 P 在模式串 S 中多次作为子串出现。

求出模板串 P 在模式串 S 中所有出现的位置的起始下标。

输入格式

第一行输入整数 N,表示字符串 P 的长度。

第二行输入字符串 P。

第三行输入整数 M,表示字符串 S 的长度。

第四行输入字符串 S。

输出格式

共一行,输出所有出现位置的起始下标(下标从 0 开始计数),整数之间用空格隔开。

数据范围

1≤N≤105

1≤M≤106

输入样例:

3

aba

5

ababa

输出样例:

0 2
#include <iostream>

typedef unsigned long long ull;
const int N = 1e5 + 10, M = 1e6 + 10, P = 131;
//h1/h2存储长/短的字符串前i个字符的哈希值,p是P的i次方的值
ull h1[M], h2[N], p[M];
int n, m;
char str[M], substr[N];

ull find(int l, int r)
{
    return h1[r] - h1[l - 1] * p[r - l + 1];
}

int main()
{
    scanf("%d%s%d%s", &n, substr + 1, &m, str + 1);
    p[0] = 1;
    for(int i=1;i<=m;i++)
    {
        p[i] = p[i - 1] * P;
        h1[i] = h1[i - 1] * P + str[i];
        if(i <= n)
        {
            h2[i] = h2[i - 1] * P + substr[i];
        }
    }
    for(int i=1;i+n-1<=m;i++)
    {
        if(find(i, i + n - 1) == h2[n]) printf("%d ", i - 1);
    }
    return 0;
}
           

继续阅读