【转】HDOJ 1042 解题报告

第一次写解题报告，仔细研究一道题的感觉很不错。呵

报告的内容：

1.计算大数乘法的朴素版本

“传说”中的x位一存是什么意思，怎么来的。

2.四位一存

3.九位一存

4.五位一存（仅适用此题的最快版本）

5.大数乘法模板（9位一存）

1. 一位一存，下面那些版本的根源，建议大家先把这个程序的过程理解明白，欲速则不达啊，呵呵~

运行结果见代码下面:

#include <stdio.h>
#include <string.h>
int main()
{
    int a[40000],c[40000];//10000^10000也就40001位，10000！可以估计出是30000多位，所以开40000大小的数组

    int b[10];

    int n;
    int i,j,k;
    int l,la,lb,lc;

    while(EOF != scanf("%d",&n))
    {
        if(n==0 || n==1) { printf("1\n"); continue;} //几种特殊情况

        a[0] = 1;
        la = 1; //注意之后要读取la
        for(k=2; k<=n; k++)
        {
            l = k;
            lb = 0;
            for(j=0; l; j++) {b[j] = l%10; l /= 10; lb++;} //把整型数放入数组
            memset(c,0,sizeof(c));

            for(j=0; j<lb; j++) //模拟乘法运算的过程
                for(i=0; i<la; i++)
                {
                    c[j+i] += b[j]*a[i];
                    c[j+i+1] += c[j+i]/10;
                    c[j+i] %= 10;
                    lc = i+j+1;       }//c数组的位数，假设每次都有进位

            if(0 == c[lc]) lc--;
            la = lc+1;

            for(i=0; i<=lc ;i++)
                a[i] = c[i];

        }

        for(i=lc; i>=0; i--)
            printf("%d",a[i]);
        printf("\n");
    }
    return 0;
}

Time Limit Exceeded 1042 5000MS 468K

可见,这样根本通不过,5000MS的时间都不够

2.4位一存

int数组里只存一个单位数,0~9,这显然是对int的一种浪费,而且似乎9999*9999并不比9*9慢多少?(见<<算法艺术与信息学竞赛>>),那么我们尝试每个a[i]里多存几位

我们知道int的范围是21亿多,如果a[i]里存的数位5位数,99999*99999将大于int可表示的范围,所以我们让a[i]存4位的整数,将避免溢出的问题.四位一存算法应运而生了~

#include <stdio.h>
#include <string.h>
#define MOD 10000
int main()
{
    int a[10000],b[6],c[10000];//10000!大概有10000*4=40000位,4位一存,数组大小需要开40000/4=10000的大小
    int i,j,k,n,l,la,lb,lc;

    while(EOF !=scanf("%d",&n))
    {
        if(n==0||n==1) {printf("1\n");continue;} //几种特殊情况

        for(a[0]=1, la=1, k=2; k<=n; k++)
        {
            for(l=k,lb=0,i=0; l; i++) { b[i] = l%MOD; l/=MOD;lb++;}

            memset(c,0,sizeof(c));
            for(j=0; j<lb; j++)
                for(i=0; i<la; i++)
                {
                    c[j+i] += b[j]*a[i];
                    c[j+i+1] += c[j+i]/MOD;
                    c[j+i] %= MOD;
                }
            la = la+lb; //两个数相乘，假设a有4位，b有2位，那么a*b可能是5位或者6位,先假设有6位
            if(0 == c[la-1]) la--; //看一下有没有第六位，第六位即c[5]

            for(i=0; i<la; i++) a[i] = c[i];
        }

        printf("%d",a[la-1]);
        for(i=la-2; i>=0; i--)
            printf("%04d",a[i]);
        printf("\n");
    }
    return 0;
}

Accepted 1042 562MS 260K

由截图知,速度果然大大提升,原来的TLE,现在500MS就通过了

3.9位一存:

由4位一存的结果我们可以继续想,继续每个a[i]多存几位真的可以变快,那再多存几位,应用__int64这个类型,我们存9位如何?

结果见代码后面.

#include <stdio.h>
#define    MOD    1000000000
#define LEN    4000
/*计算 n!*/
int mut(int r[], int n)
{
    int i, j, p=1;
    __int64 t = 0;
    r[0] = 1;
    for(i=2; i<=n; i++)
    {
        /*对r中每个可用元素依次和i相乘*/
        for(j=0; j<p; j++)    //注意:这里面的3句话和上面的代码不一样,自己重新推敲一下
        {                            /*并且由于9位一存,b数组不再有存在的必要,每次都只用到b[0]而已,进而导致c数组也没有存在的必要*/
            t = (__int64)r[j] * i + t;/*防止r[j]*i结果被int32_t截断，先转化为int64再计算*/
            r[j] = t % MOD ;
            t = t / MOD;
        }
        /*一轮乘法过后，是否产生新的进位*/
        if (t > 0)
        {
            r[p++] = t;
            t = 0;
        }
    }
    return p;
}
/*输出*/
void print(int r[], int p)
{
    for(printf("%d",r[--p]); p--;)
    {
        printf("%09d", r[p]);/*中间数字补0*/
    }
    puts("");
}

int main()
{
    int r[LEN], n, p;/*大整数数组，当前输入的n，数组中已使用的元素个数*/

    while(scanf("%d",&n)!=EOF)
    {
        p = mut(r, n);
        print(r, p);
    }
    return 0;
}

Accepted 1042 531MS 192K

结果表明,速度几乎没有提升.为什么?因为32机本来就不支持64位的数,肯定是在处理__int64数据类型的时候耗费太多的时间(具体可以自己查看汇编代码),那么还能更快吗?

4.a[i]里存的位数要尽量多,还要避免__int64的使用,结合题意,我们可以5位一存,因为相乘的两个数一个最大是10000，另一个即使是99999也不超过int可表示的最大类型.数组b和c这里也同样不再需要.

#include <stdio.h>
#include <string.h>

//#include <stdlib.h>
//#include <time.h>

#define MOD 100000
int main()
{

//    clock_t start,finish;
//    double duration;

    int a[8000];//10000!大概有10000*4=40000位,5位一存,数组大小需要开40000/5=8000的大小

int i,k,n,t,la;

    while(EOF !=scanf("%d",&n))
    {
//        start = clock();
        if(n==0||n==1) {printf("1\n");continue;} //特殊情况

        a[0] = 1;
        la = 1;
        t=0;
        for(k=2; k<=n; k++)
        {
            for(i=0; i<la; i++)
            {
                t += k * a[i];
                a[i] = t%MOD;
                t = t/MOD;
            }
            if (t > 0) //一轮乘法过后，是否产生新的进位
            {
                a[la++] = t;
                t = 0;
            }
        }
//        finish = clock();
        printf("%d",a[la-1]);
        for(i=la-2; i>=0; i--)
            printf("%05d",a[i]);
        printf("\n");

//        duration = (double)(finish-start)/CLOCKS_PER_SEC;
//        printf("%lf\n",duration);
    }
    return 0;
}

Accepted 1042 296MS 212K

果然,速度再次有了不小的提升.

5.大数乘法模板

1）4位一存

#include <stdio.h>
#include <string.h>

#include <stdlib.h>
#include <time.h>
#define LEN 10000
#define MOD 10000
int main()
{

clock_t start,finish;
double duration;

char s1[LEN],s2[LEN];
int a[LEN],b[LEN],c[2*LEN];//此模板使用范围，相乘的两个数每个数小于40000位，可容纳80000以内的结果
int i,j,la,lb,lc,pos;

while(EOF !=scanf("%s%s",s1,s2))
{
start = clock();

   memset(a,0,sizeof(a));
   memset(b,0,sizeof(b));
   memset(c,0,sizeof(c));

   for(la=0,pos=strlen(s1)-4; pos>=0; pos-=4)
    a[la++] = (s1[pos]-48)*1000 + (s1[pos+1]-48)*100 + (s1[pos+2]-48)*10 + (s1[pos+3]-48);
   pos += 4;
   for(j=0; j<pos; j++)
    a[la] = a[la]*10 + (s1[j]-48);
   if(j>0)
    la++;


   for(lb=0,pos=strlen(s2)-4; pos>=0; pos-=4)
    b[lb++] = (s2[pos]-48)*1000 + (s2[pos+1]-48)*100 + (s2[pos+2]-48)*10 + (s2[pos+3]-48);
   pos += 4;
   for(j=0; j<pos; j++)
    b[lb] = b[lb]*10 + (s2[j]-48);
   if(j>0)
    lb++;


   for(j=0; j<lb; j++)
    for(i=0; i<la; i++)
    {
     c[j+i] += b[j]*a[i];
     c[j+i+1] += c[j+i]/MOD;
     c[j+i] %= MOD;
    }

   lc = la + lb;
   if(0 == c[lc-1])
    lc--;

finish = clock();

   printf("%d",c[lc-1]);
   for(i=lc-2; i>=0; i--)
    printf("%04d",c[i]);
   printf("\n");

duration = (double)(finish-start)/CLOCKS_PER_SEC;
printf("%lf\n",duration);
}
return 0;
}

2）九位一存

#include <stdio.h>
#include <string.h>

#include <stdlib.h>
#include <time.h>
#define LEN 10000
#define MOD 1000000000
int main()
{

clock_t start,finish;
double duration;

char s1[LEN],s2[LEN];
int a[LEN],b[LEN];
__int64 c[2*LEN];//此模板使用范围，相乘的两个数每个数小于90000位，可容纳180000以内的结果
int i,j,la,lb,lc,pos;

while(EOF !=scanf("%s%s",s1,s2))
{
start = clock();

   memset(a,0,sizeof(a));
   memset(b,0,sizeof(b));
   memset(c,0,sizeof(c));

   for(la=0,pos=strlen(s1)-9; pos>=0; pos-=9)
    a[la++] = (s1[pos]-48)*100000000 + (s1[pos+1]-48)*10000000 + (s1[pos+2]-48)*1000000 + (s1[pos+3]-48)*100000 + (s1[pos+4]-48)*10000 + (s1[pos+5]-48)*1000 + (s1[pos+6]-48)*100 + (s1[pos+7]-48)*10 + (s1[pos+8]-48);
   for(pos += 9,j=0; j<pos; j++)
    a[la] = a[la]*10 + (s1[j]-48);
   if(j!=0) la++;


   for(lb=0,pos=strlen(s2)-9; pos>=0; pos-=9)
    b[lb++] = (s2[pos]-48)*100000000 + (s2[pos+1]-48)*10000000 + (s2[pos+2]-48)*1000000 + (s2[pos+3]-48)*100000 + (s2[pos+4]-48)*10000 + (s2[pos+5]-48)*1000 + (s2[pos+6]-48)*100 + (s2[pos+7]-48)*10 + (s2[pos+8]-48);
   for(pos += 9,j=0; j<pos; j++)
    b[lb] = b[lb]*10 + (s2[j]-48);
   if(j!=0) lb++;


   for(j=0; j<lb; j++)
    for(i=0; i<la; i++)
    {
     c[j+i] += (__int64)b[j]*a[i];
     c[j+i+1] += c[j+i]/MOD;
     c[j+i] %= MOD;
    }

   lc = la + lb;
   if(0 == c[lc-1])
    lc--;

finish = clock();

   printf("%I64d",c[lc-1]);
   for(i=lc-2; i>=0; i--)
    printf("%09I64d",c[i]);
   printf("\n");

duration = (double)(finish-start)/CLOCKS_PER_SEC;
printf("%lf\n",duration);
}
return 0;
}

结果发现在计算a*a（a为9999...99999,1W个9）的时候，这两个版本都是0.016秒，似乎还是难分伯仲~~

但是比普通的大数乘法模板的确快很多，普通的已经需要17秒多

posted @ 2013-05-09 15:02 Geekers 阅读(262) 评论(0) 收藏举报

刷新页面返回顶部

废弃都市

废弃者

【转】HDOJ 1042 解题报告

公告