( 動态規劃專題 )【 最長公共子序列(LCS) 】
原文:https://blog.csdn.net/weixin_40673608/article/details/84262695
相關概念
子序列形式化定義:
給定一個序列X=<x1,x2,x3,x4...,xm>,另一個序列Z=<z1,z2,z3,z4...,zk>,若存在一個嚴格遞增的X的下标序列<i1,i2,i3,...,ik>對所有的1,2,3,...,k,都滿足x(ik)=zk,則稱Z是X的子序列
比如Z=<B,C,D,B>是X=<A,B,C,B,D,A,B>的子序列
公共子序列定義:
如果Z既是X的子序列,又是Y的子序列,則稱Z為X和Y的公共子序列
最長公共子序列(以下簡稱LCS):
2個序列的子序列中長度最長的那個
方法
蠻力法求解最長公共子序列:
需要周遊出所有的可能,時間複雜度是O(n³),太慢了
動态規劃求解最長公共子序列:
分析規律:
設X=<x1,x2,x3,x4...,xm>,Y=<y1,y2,y3,y4...,yn>為兩個序列,Z=<z1,z2,z3,z4...,zk>是他們的任意公共子序列
經過分析,我們可以知道:
1、如果xm = yn,則zk = xm = yn 且 Zk-1是Xm-1和Yn-1的一個LCS
2、如果xm != yn 且 zk != xm,則Z是Xm-1和Y的一個LCS
3、如果xm != yn 且 zk != yn,則Z是X和Yn-1的一個LCS
是以如果用一個二維數組c表示字元串X和Y中對應的前i,前j個字元的LCS的長度話,可以得到以下公式:
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnL5MDN3AzNyITMwITMxgTMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
文字意思就是:
設
p1表示X的前 i-1 個字元和Y的前 j 個字元的LCS的長度
p2表示X的前 i 個字元和Y的前 j-1 個字元的LCS的長度
p表示X的前 i-1 個字元和Y的前 j-1 個字元的LCS的長度
p0表示X的前 i 個字元和Y的前 j 個字元的LCS的長度
如果X的第 i 個字元和Y的第 j 個字元相等,則p0 = p + 1
如果X的第 i 個字元和Y的第 j 個字元不相等,則p0 = max(p1,p2)
做法:
是以,我們隻需要從c[0][0]開始填表,填到c[m-1][n-1],所得到的c[m-1][n-1]就是LCS的長度
但是,我們怎麼得到LCS本身而非LCS的長度呢?
也是用一個二維數組b來表示:
在對應字元相等的時候,用↖标記
在p1 >= p2的時候,用↑标記
在p1 < p2的時候,用←标記
僞代碼:
若想得到LCS,則再周遊一次b數組就好了,從最後一個位置開始往前周遊:
如果箭頭是↖,則代表這個字元是LCS的一員,存下來後 i-- , j--
如果箭頭是←,則代表這個字元不是LCS的一員,j--
如果箭頭是↑ ,也代表這個字元不是LCS的一員,i--
如此直到i = 0或者j = 0時停止,最後存下來的字元就是所有的LCS字元
比如說求ABCBDAB和BDCABA的LCS:
灰色且帶↖箭頭的部分即為所有的LCS的字元