题目描述

给你两个字符串 haystack 和 needle ，请你在 haystack 字符串中找出 needle 字符串出现的第一个位置（下标从 0 开始）。

如果不存在，则返回 -1 。

问题分析

字符串搜索（匹配子串）是一个很经典也具有实际应用场景的问题。

针对不同难度定位（数据范围）有不同的解法：

如果只是某道题的其中一个环节的话，我们可以直接调用语言自带的 indexOf() 方法；
如果是一道简单题（数据范围 ~）的话，我们可以使用「双指针」解法；
如果是一道中等题（数据范围 ~）的话，则是在考察我们 KMP 等字符串匹配算法。

朴素解法

枚举原串 ss 中的每个字符作为「发起点」，每次从原串的「发起点」和匹配串的「首位」开始尝试匹配：

匹配成功：返回本次匹配的原串「发起点」。

匹配失败：枚举原串的下一个「发起点」，重新尝试匹配。

代码:

class Solution {
    public int strStr(String ss, String pp) {
        int n = ss.length(), m = pp.length();
        char[] s = ss.toCharArray(), p = pp.toCharArray();
        // 枚举原串的「发起点」
        for (int i = 0; i <= n - m; i++) {
            // 从原串的「发起点」和匹配串的「首位」开始，尝试匹配
            int a = i, b = 0;
            while (b < m && s[a] == p[b]) {
                a++;
                b++;
            }
            // 如果能够完全匹配，返回原串的「发起点」下标
            if (b == m) return i;
        }
        return -1;
    }
}

KMP算法

KMP算法一种改进的模式匹配算法，是D.E.Knuth、V.R.Pratt、J.H.Morris于1977年联合发表，KMP算法又称克努特-莫里斯-普拉特操作。

它的改进在于：每当从某个起始位置开始一趟比较后，在匹配过程中出现失配，不回溯i，而是利用已经得到的部分匹配结果，将一种假想的位置定位“指针”在模式上向右滑动尽可能远的一段距离到某个位置后，继续按规则进行下一次的比较

比如当我们在主串下标为3匹配子串，往后继续匹配主串，在下标是10的位置主串和子串不匹配，这个时候就要把子串往后移动到首字母相同的位置继续匹配，但其实我们中间已经匹配了很多字符了，里面是有一些额外信息在里面的。我们利用这些额外信息就可以帮我们少枚举一些东西。

KMP算法中最难的next数组的含义。

next[i]表示的就是以i为终点的后缀和从1开始的前缀相等，且相同的部分最长，这里我们默认子串下标从1开始。比如next[i]=j就表示在子串中p[1,j]=p[i-j+1,i]，这里我们用p数组暂时表示子串，这个就表示子串中下标从1到j这一段和i-j+1到i是相等的，而且长度最长。所以下次从j+1再开始继续匹配。

next 数组的值是除当前字符外（注意不包括当前字符）的公共前后缀最长长度

求next数组最重要的一点是找最长公共前后缀，什么是前后缀呢

前缀是除了最后一个字符的所有子串。

后缀是除了第一个字符的所有子串。

举个栗子

比如子串是ababababab，我们求他的next数组,子串下标从1开始

很明显next[1]=0，因为第一个默认是0

next[2]=0,因为没有公共前后缀

next[3]=1，最长公共前后缀是a

next[4]=2,最长公共前后缀是ab

Next[5]=3,最长公共前后缀是aba，依次类推next[6]=4.....

我们可以发现next数组的值就是子串退回时的下标

public class Solution {
    public static int[] getNext(String ps) {
        char[] p = ps.toCharArray();
        int[] next = new int[p.length];
        next[0] = -1;
        int j = 0;
        int k = -1;
        while (j < p.length - 1) {
            if (k == -1 || p[j] == p[k]) {
                next[++j] = ++k;
            } else {
                k = next[k];
            }
        }
        return next;
    }

    public static int KMP(String ts, String ps) {
        char[] t = ts.toCharArray();
        char[] p = ps.toCharArray();
        int i = 0; // 主串的位置
        int j = 0; // 模式串的位置
        int[] next = getNext(ps);
        while (i < t.length && j < p.length) {
            if (j == -1 || t[i] == p[j]) { 
                // 当j为-1时，要移动的是i，当然j也要归0
                i++;
                j++;
            } else {
                // i不需要回溯了
                // i = i - j + 1;
                j = next[j]; // j回到指定位置
            }
        }
        if (j == p.length) {
            return i - j;
        } else {
            return -1;
        }
    }
}

高端面试必备：KMP算法

题目描述

问题分析

朴素解法

KMP算法

继续阅读

UART协议

面试必备！这些高频CSS面试题来了！

全网好评！程序员面试必备的Java八股文，适合所有的Java求职者！

面试必备：你没大文件上传功能？那你回去等通知吧！（转载）

0基础学会死锁、读写锁（解决线程同步的问题）内附C语言源码一、死锁二、读写锁

2020前端知识点汇总(五)-vue

前端面试必备：Vuex的简单使用及原理分析

系统解析JDK源码，领略大牛设计思想，JAVA面试必备-梦入江南烟

害怕被迫转行？那就重视学习算法吧！#程序员学习算法有以下几点好处提高编程能力：数据结构和算法是编程的基础，掌握了它们可以

教师面试必备！教师结构化面试精选100题！需要的小伙伴评论区自取！#钟山区教师#钟山区事业单位招聘#教师结构化面试

面试必备-常用设计模式设计模式的三种类型

面试必备——mysql之索引mysql之索引

C++工程师面试题（是否都会）

结构化面试必备真题（二）#结构化面试#人才引进面试#事业单位面试#公务员面试#人才引进

前端面试必备总结：CSS盒模型与BFC

java面试必备：七个常见的Java算法问题和示例答案