五笔的编码和解码

Q:五笔的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把五笔的编码按字典序排序,形成一个数组如下:
    a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, baac … …, yyyw, yyyx, yyyy
其中a的Index为0,aa的Index为1,aaa的Index为2,以此类推。
1)编写一个函数,输入是任意一个编码,比如baca,输出这个编码对应的Index;
2)编写一个函数,输入是任意一个Index,比如12345,输出这个Index对应的编码。


A:初看一下,编码并不是按照数位大小进行,而是按照字典序进行排序。首先通过枚举一些例子找找规律。

index[a]=0,index[aa]=1,index[aaa]=2,index[aaaa]=3,前四个字符串的规律是strlen(str)-1。

我们再看已知index[a]求index[b]。a,aa,aaaa,aaab,…,ayyy。其中aa->ay(25个数),aaa->ayyy(25*25个数),aaaa->ayyy(25*25*25个数),这样index[b]=index[a]+25^3+25^2+25+1

再看已知index[aa]求index[ab]。aa,aaa,aaaa,aaab,…,aayy。其中aaa->aay(25个数),aaaa->aayy(25*25个数),这样index[ab]=index[aa]+25^2+25+1

再看已知index[aaa]求index[aab]。aaa,aaaa,…,aaay。其中aaaa->aaay(25个数)。这样index[aab]=index[aaa]+25+1

再看已知index[aaaa]求index[aaab]。index[aaab]=index[aaaa]+1。

这样我们就可以将上述因子放在一个数组里。factor[]={25^3+25^2+25+1,25^2+25+1,25+1,1}

我们以bdce为例说明。

对字符串从左到右遍历,首先发现的是b,b距离a的相对index=factor[0],而index[a]=0,所以到达b是factor[0];再看第二个字符d,bd距离ba的长度为factor[1]*(b-a),而ba距离b的长度又为1;所以到达bd是1+factor[0]+factor[1]*(b-a);再看第三个字符c,bdc到bda的长度为factor[2]*(c-a),而bda距离bd的长度又为1,所以到达bdc是1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a);最后再看e,bdce到bdca的长度为factor[3]*(e-a),而bdca距离bdc的长度又为1,所以到达dbce是1+1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a)。所以编码就出来了。

int factor[]={25*25*25+25*25+25+1,25*25+25+1,25+1,1};
int encode(char *str)
{
	int len=strlen(str);
	int index=len-1;
	for(int i=0;i<len;++i)
	{
		index+=factor[i]*(str[i]-'a');
	}
	return index;
}

 

对于第二个问题,解码就是编码的逆过程,也是顺序求字符串的1234个字符就行。

char* decode(int index)
{
	char str[4];
	int i=0;
	while(index>=0)
	{
		str[i]='a'+index/factor[i];
		index=index%factor[i];
		--index;
		++i;
	}
	str[i]='\0';
	return str;
}
posted @ 2012-07-20 09:36  Cavia  阅读(2898)  评论(0编辑  收藏  举报