测试c语言函数调用性能因素之测试三

函数调用:即调用函数调用被调用函数,调用函数压栈,被调用函数执行,调用函数出栈,调用函数继续执行的一个看似简单的过程,系统底层却做了大量操作。

操作:

1,               调用函数帧指针(函数参数,局部变量,栈帧状态值,函数返回地址)入栈,栈指针自减

2,               保存调用函数的状态数据入寄存器

3,               被调用函数帧指针入栈,执行当前的被调用函数

4,               被调用函数执行结束,退栈,返回到调用函数的帧指针,从寄存器中恢复当时状态数据

5,               继续执行调用函数,直至结束

即整个调用操作有一个压栈出栈,保存和恢复状态数据的过程。而系统栈内存是有默认的固有大小。有多少次函数调用就会分配多少栈帧。故,函数调用性能影响有如下因素:

1,函数递归层数;

2,参数个数(参数签名所占内存大小)

         2.1同类型不同参数个数;

         2.2同参数个数不同参数类型;

         2.3同参数类型同参数个数,但参数类型所占内存大小不同;

3,函数栈大小,即函数局部变量所占栈大小。

为了测试C语言函数调用性能(时间消耗)因素,编写了一个简单程序运行在如下环境中:

                                    Intel(R) Core(TM) i5-2400 CPU @ 3.10GHz  memery size:7833700 kB(7.47GB)

在函数调用的开始与结束处,用time.h中的clock()函数返回CPU时钟计时单位数(下表中的starttime和endtime),用durationtime=endtime-starttime表示函数调用的时间消耗。如下:

clock_t  starttime=clock();

函数调用…

clock_t  endtime=clock();

//除以CLOCKS_PER_SEC,得到以秒为单位的时间结果

double durationtime=(double)(endtime-starttime)/CLOCKS_PER_SEC;//表示函数调用占用cpu的时间,不包括子进程或者printf等的操作的时间

 

注:clock()记录的是进程占用cpu的时间,精确度为微秒;详细讲解clock()函数的网址:http://site.douban.com/199048/widget/notes/12005386/note/253542964/

一.函数递归层数(循环1000000次

栈(字节)

参数(字节)

递归次数

总函数调用时间消耗(秒)

每循环函数调用时间消耗(微秒)

每次函数调用平均时间消耗(纳秒)

1024

24

10

2.9

2.9

290

1024

24

20

5.713

5.713

285.65

1024

24

30

9.025

9.025

300.83

1024

24

50

16.0767

16.0767

321.534

1024

24

80

21.79

21.79

272.375

1024

24

100

30.73

30.73

307.3

1024

24

200

66.24

66.24

331.2

 

 

 

 

 

 

 

 

 

 

 

 

 

注:平均每次函数调用时间消耗=durationtime/调用层数/ 循环次数

      每循环函数调用时间消耗=durationtime/ 循环次数

 

函数调用根据不同的调用层数不同的时间平均消耗,如下折线图:

                                                                                    图1

每次函数调用平均时间消耗,如下折线图:

                                                                               图2

结论:1,在参数所占内存相同和函数栈大小相同的情况下,函数调用的时间消耗随着函数调用层数增加而增加;如图1;

        2,在参数所占内存相同和函数栈大小相同的情况下,每次函数调用的时间消耗大概在300纳秒左右;如图2;

 

二,函数栈大小

循环次数

栈(字节)

参数

(字节)

递归次数

总函数调用时间消耗(秒)

每循环函数调用时间消耗(微秒)

平均每次函数调用(纳秒)

1000000

16

24

50

9.4

9.4

184

1000000

32

24

50

9.37

9.37

187.4

1000000

64

24

50

9.5

9.5

190

1000000

128

24

50

10.415

10.415

208.3

1000000

256

24

50

11.805

11.805

236.1

1000000

512

24

50

14

14

280

1000000

1024

24

50

16.0767

16.0767

321.534

1000000

2048

24

50

18.42

18.42

368.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

注:平均每次函数调用时间消耗=durationtime/调用层数/ 循环次数

      每循环函数调用时间消耗=durationtime/ 循环次数

 

函数调用根据不同的调用层数不同的时间平均消耗,如下折线图:

                                                                            图3

 

 

每次函数调用平均时间消耗,如下折线图:

 

                                                                                图4

 

结论:1,在函数参数相同和函数调用层数相同的情况下,函数调用时间消耗随函数栈大小的增加而增加;如图3;

        2,在函数参数相同和函数调用层数相同的情况下,每次函数调用时间消耗随函数栈大小的增加而增加;如图4

 

三,参数个数

栈(字节)

参数

(字节)

递归次数

总函数调用时间消耗(秒)

每循环函数调用时间消耗(微秒)

平均每次函数调用(纳秒)

1024

24

50

16.0767

16.0767

321.5

1024

36

50

16.245

16.245

324.9

1024

48

50

16.345

16.345

326.9

1024

60

50

15.915

15.915

318.3

1024

72

50

14.29

14.29

285.8

1024

84

50

15.76

15.76

315.2

1024

96

50

15.14

15.14

302.8

1024

108

50

13.975

13.975

279.5

1024

120

50

16.68

16.68

333.6

1024

144

50

15.37

15.37

307.4

1024

180

50

14.42

14.42

288.4

1024

192

50

14.62

14.62

292.4

    

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

注:平均每次函数调用时间消耗=durationtime/调用层数/ 循环次数

      每循环函数调用时间消耗=durationtime/ 循环次数

函数调用根据不同的函数参数大小的时间平均消耗,如下折线图:

每次函数调用平均时间消耗,如下折线图:

 

 

    结论:  经过前几次的函数测试,虽然存在误差,但是仍然可以得出参数对于函数调用的时间消耗的影响,在于参数所占内存大小;函数传参存在两种方式:值传参和引用传参;两种方式在一般情况下,不会占用过多的内存;故,在一般情况下,参数对函数调用的时间消耗的影响不明显;

 

四,结论:

    1,在函数参数大小为24字节和函数栈大小为1024字节的情况下,递归50次的函数时间消耗为16.0767微秒,可以粗略得出每次函数调用(压栈出栈)的时间消耗为320纳秒左右;

 

思路:1,函数参数大小:函数参数分为值传参和引用传参(参数的指针);一般值传参为常用的值类型,这样的参数一般不会占用过多的内存;引用参数是参数地址也不会占用过多内存;所以在一般情况下,函数参数对函数调用时间消耗影响不大;

        2,计数:循环1000000次函数递归,是为了想提高数据的精确性和便于计算;1秒=1000000微秒;

        3,递归层数:选择可能常规下递归的层数(24--35)

       4,函数栈大小:按照以太网的最大字节1500字节,选择在1024字节左右做以上实验;

代码:

 1 #include<stdio.h>
 2 #include<stdlib.h>
 3 #include<string.h>
 4 #include<time.h>
 5 #define array_len 256
 6 typedef struct {
 7  int typeone;
 8  int typetwo;
 9 }struct_type;
10 long call_back(int call_num,int typeone,int typetwo,int typethree,long p_recorde)
11 {
12  if(call_num<=0)return p_recorde;
13  int i_rand[array_len];
14  int i=0;
15  clock_t start_time,end_time;
16  start_time=clock();
17  for(i=0;i<array_len;i++)
18  {
19     i_rand[i]=rand(); 
20  }
21  end_time=clock();
22  p_recorde+=(long)(end_time-start_time);
23  call_back(call_num-1,typeone,typetwo,typethree,p_recorde);
24 }
25 void main(int argc,char *argv[])
26 {
27   int loop_num=atoi(argv[1]),call_num=atoi(argv[2]);
28   long p_recorde=0,sum=0;
29   clock_t start_time,end_time;
30   start_time=clock();
31   int i;
32   for(i=0;i<loop_num;i++)
33   {
34    sum_loop+=call_back(call_num,0,0,0,p_recorde);
35   }
36   end_time=clock();
37   double duration_time=(double)(end_time-start_time)/CLOCKS_PER_SEC-(double)sum_loop/CLOCKS_PER_SEC;
38   printf("sum=%f   duration=%f\n",sum_loop,duration_time);
39 }

 

 

代码思路:1,为了减少数据cache命中的影响,在每次函数调用中用了rand()获取随机数,并记录时间消耗a;

              2,记录函数调用的时间总消耗b,b-a的差即为函数调用的时间总消耗;

posted on 2015-08-11 13:32  woshare  阅读(3711)  评论(0编辑  收藏  举报