学习manacher(最长公共回文串算法)

2023-05-28

给定一个字符串求出其中最长个公共回文串.

举列子: abab   -->回文串长度为2

以前的算法诸如: 扩展kmp求法过于麻烦,看到有一篇博文(http://leetcode.com/2011/11/longest-palindromic-substring-part-ii.html),写了一个关于这样的算法,按耐不住自己内心的小激动,就去学了下,于是将自己学习的一点点的理解记录下来:

它的处理方法是:  对于这样一个字符串: abab;

a b a b     我们对于每一个字符串的进行逐个匹配

1 2 2 1

对于奇数长度的字符串  ababa   -->回文串的长度为:

a b a b a   ( 这是对于每一个字符串进行模式匹配)  之间复杂度为 O(n*m)

1 2 3  2 1

而现在我们学习的一种算法是时间复杂度为O(n)

算法的思想是: 设置一个匹配半径ra , 然后分为三种情况进行讨论: (当然讨论主要是缩减不必要的重复匹配)

由于已经有好些博主写的较为详细,自己就不在胡乱填鸭了.....

以下引用的是 这位楼主的博客  (http://blog.sina.com.cn/s/blog_70811e1a01014esn.html)

首先,在字符串s中,用rad[i]表示第i个字符的回文半径,即rad[i]尽可能大,且满足:
s[i-rad[i],i-1]=s[i+1,i+rad[i]]
很明显,求出了所有的rad,就求出了所有的长度为奇数的回文子串.
至于偶数的怎么求,最后再讲.
假设现在求出了rad[1..i-1],现在要求后面的rad值,并且通过前面的操作,得知了当前字符i的rad值至少为j.现在通过试图扩大j来扫描,
求出了rad[i].再假设现在有个指针k,从1循环到rad[i],试图通过某些手段来求出[i+1,i+rad[i]]的rad值.

根据定义,黑色的部分是一个回文子串,两段红色的区间全等.
因为之前已经求出了rad[i-k],所以直接用它.有3种情况:

①rad[i]-k<rad[i-k]
如图,rad[i-k]的范围为青色.因为黑色的部分是回文的,且青色的部分超过了黑色的部分,所以rad[i+k]肯定至少为rad[i]-k,即橙色
的部分.那橙色以外的部分就不是了吗?这是肯定的.因为如果橙色以外的部分也是回文的,那么根据青色和红色部分的关系,可以证明黑色部分再往外延伸一点也
是一个回文子串,这肯定不可能,因此rad[i+k]=rad[i]-k.为了方便下文,这里的rad[i+k]=rad[i]-
k=min(rad[i]-k,rad[i-k]).

②rad[i]-k>rad[i-k]
如图,rad[i-k]的范围为青色.因为黑色的部分是回文的,且青色的部分在黑色的部分里面,根据定义,很容易得出:rad[i+k]=rad[i-k].为了方便下文,这里的rad[i+k]=rad[i-k]=min(rad[i]-k,rad[i-k]).

根据上面两种情况,可以得出结论:当rad[i]-k!=rad[i-k]的时候,rad[i+k]=min(rad[i]-k,rad[i-k]).

注意:当rad[i]-k==rad[i-k]的时候,就不同了,这是第三种情况:

如图,通过和第一种情况对比之后会发现,因为青色的部分没有超出黑色的部分,所以即使橙色的部分全等,也无法像第一种情况一样引出矛盾,因此橙色的部分是
有可能全等的,但是,根据已知的信息,我们不知道橙色的部分是多长,因此就把i指针移到i+k的位置,j=rad[i-k](因为它的rad值至少为
rad[i-k]),等下次循环的时候再做了.

整个算法就这样.
至于时间复杂度为什么是O(n),我已经证明了,但很难说清楚.所以自己体会吧.
上文还留有一个问题,就是这样只能算出奇数长度的回文子串,偶数的就不行.怎么办呢?有一种直接但比较笨的方法,就是做两遍(因为两个程序是差不多的,只
是rad值的意义和一些下标变了而已).但是写两个差不多的程序是很痛苦的,而且容易错.所以一种比较好的方法就是在原来的串中每两个字符之间加入一个特
殊字符,再做.如:aabbaca,把它变成a#a#b#b#a#c#a,这样的话,无论原来的回文子串长度是偶数还是奇数,现在都变成奇数了

于是有这种思想我们不难写出这样的代码:

代码:

 #include<stdio.h>
#include<string.h>
#include<stdlib.h>
#define maxn 1000000
char str[maxn];
int ra[maxn];
int min(int a,int b)
{
return a<b?a:b;
}
void init(char s[],int len){
int en=(len<<)+;
memset(ra,,sizeof(int)*(en+));
while(en>){
if(en&) str[en]='#';
else str[en]=str[--len];
en--;
}
s[en]='$';
}
int manacher (int len ){
len=len*-;
int ce=,mx=,ans=;
for(int i=;i<=len;i++){
if(mx>i) ra[i]=min(ra[(ce<<)-i],mx-i); //位置在回文串的范围之内
else ra[i]=;
while(str[i+ra[i]]==str[i-ra[i]]) //以i点为中心进行模式匹配
ra[i]++;
if(i+ra[i]>mx){
mx=i+ra[i];
ce=i;
}
if((i&)&&ans<ra[i])
ans=ra[i];
}
memset(str,,sizeof(str));
return ans;
}
int main(){
while(scanf("%s",str)!=EOF){
int len=strlen(str);
init(str,len);
printf("%d\n",manacher(len)-);
}
return ;
}

学习manacher(最长公共回文串算法)的相关教程结束。