#include<iostream>
#include<string>
using namespace std;
struct huffTree
{
int parent;
int lchild;
int rchild;
int weight;
string flag;
};
struct Lowest_Node//第0级节点的字符与频度
{
char ch;
int ch_num;
};
void coding(int length,huffTree tree[],int n,int &a,int &b)
{
int i;
int r,s;
r=s=length;//节点个数不会超过字符的长度
for(i=0;i<n;i++)
{
if((tree[i].weight<r)&&(tree[i].parent==-1))
{
r=tree[i].weight;
a=i;
}
}
for(i=0;i<n;i++)
{
if((tree[i].weight<s)&&(i!=a)&&(tree[i].parent==-2))
{
s=tree[i].weight;
b=i;
}
}
}
//第二部分是核心函数,frequency()的重点是计算每个字符出现的频度,从大到小排序其频度
void frequency(string str)
{
int length=str.length(); //长度
Lowest_Node *node=new Lowest_Node[length]; //声明最0级节点
int i,j; //循环因子
for(i=0;i<length;i++)
node[i].ch_num=0; //初始化频度
int char_type_num=0; //初始化为种字符
for(i=0;i<length;i++)
{
for(j=0;j<char_type_num;j++)
if(str[i]==node[j].ch||(node[j].ch>='a'&&node[j].ch<='z'&&str[i]+32==node[j].ch))
break;
if(j<char_type_num)
node[j].ch_num++;
else
{
if(str[i]>='A'&&str[i]<='Z')
node[j].ch=str[i]+32;
else
node[j].ch=str[i];
node[j].ch_num++;
char_type_num++;
}
}
//按频度从小到大排序
for(i=0;i<char_type_num;j++)
{
for(j=i;j<char_type_num;j++)
{
if(node[j].ch_num<node[j+1].ch_num)//如果前一个小于后面的交换
{
int temp;//临时频度
char ch_temp;//临时字符
temp=node[j].ch_num;
ch_temp=node[j].ch;
node[j].ch_num=node[j+1].ch_num;
node[j].ch=node[j+1].ch;
node[j+1].ch_num=temp;
node[j+1].ch=ch_temp;
}
}
}
for(i=0;i<char_type_num;i++)
cout<<"字符"<<node[i].ch<<"出现了"<<node[i].ch_num<<"次"<<endl;
huffTree *huff=new huffTree[2*char_type_num-1];//此变量的声明需要确定char_type_num值后
huffTree temp;
string *code=new string[2*char_type_num-1];//存放各个字符的编码
for(i=0;i<2*char_type_num-1;i++) //节点初始化
{
huff[i].lchild=-1;
huff[i].parent=-1;
huff[i].rchild=-1;
huff[i].flag=-1;
}
for(j=0;j<char_type_num;j++)//将排序后的第0级节点权重赋值给树节点
{
huff[j].weight=node[j].ch_num;
}
int min1,min2;
for(int k=char_type_num;k<2*char_type_num-1;k++)
{
coding(length,huff,k,min1,min2);
huff[min1].parent=k;
huff[min2].parent=k;
huff[min1].flag="0";
huff[min2].flag="1";
huff[k].lchild=min1;
huff[k].rchild=min2;
huff[k].weight=huff[min1].weight+huff[min2].weight;
}
for(i=0;i<char_type_num;i++)
{
temp=huff[i];
while(1)
{
code[i]=temp.flag+code[i];
temp=huff[temp.parent];
if(temp.parent==-1)
break;
}
}
cout<<"字符串的每个字符的编码是:"<<endl;
for(i=0;i<char_type_num;i++)
cout<<node[i].ch<<" "<<code[i]<<endl;
cout<<"整个字符串的哈夫曼编码是:"<<endl;
for(i=0;i<length;i++)
{
for(j=0;j<char_type_num;j++)
{
if(str[i]==node[j].ch)
cout<<code[j];
}
}
//释放内存
delete[] node;
node=NULL;
delete[] huff;
huff=NULL;
delete[] code;
code=NULL;
}
//第三部分是代码实现mian函数的部分
int main()
{
int length=0;//字符长度
string str;//目标 字符串
cout<<"请输入第一个字符串:"<<endl;
cin>>str;
frequency(str); //求各个元素的频度
return 0;
}