多态的内幕--(C++, C)语言两个版本

本文通过分析C++编译器生成的汇编代码，分析多态的机制。并实现了一个C语言版本。

在编译性语言里面，多态真的是一个伟大的发明。它可以现在写好代码，编译好，并且可以调用未来的代码。这多少有了点动态的感觉。

很多人，也在脚本语言里面抱怨，为什么不提供多态的功能啊。脚本语言里面，一个函数参数，可以传递任何类型，甚至可以通过函数名的字符串调用函数，

这样多态的作用就小了很多。对于面向对象来说，最重要的两个概念莫过于继承和多态。继承可以减少代码重复，多态可以减少大量的条件判断，if else switch

如果在代码中太多，你的程序应该不怎么面向对象。

废话不说了，先给一个用于分析的程序：

代码

#include <iostream>
using namespace std;

class Base
{
public:
    virtual void vfun1() {cout << " Base::vfun1()" <<endl;}
    virtual void vfun2() {cout << " Base::vfun2()" <<endl;}
    virtual void vfun3() {cout << " Base::vfun3()" <<endl;}
};

class Concrete:public Base
{
public:
    void vfun1() {cout << " Concrete::vfun1()" <<endl;}
    void vfun2() {cout << " Concrete::vfun2()" <<endl;}
};

void override_demo2(Base &obj)
{
    obj.vfun1();
    obj.vfun2();
    obj.vfun3();
}

typedef long point_t;  //32 位系统和 64 位系统上都表示标准指针的长度，但是可能不兼容16位系统，在编译的时候修改一下
typedef void (*func)();

inline void *  getvfptr(void *p, int offset)
{
    point_t *q = (point_t *)*(point_t *)p;
    // cout << q[0] << endl
    //      << q[1] << endl
    //      << q[2] << endl;
    return (void *)(q[offset]);
}

void override_demo(Base &obj)
{
    func f;
    f = (func)getvfptr(&obj, 0);
    f();
    f = (func)getvfptr(&obj, 1);
    f();
    f = (func)getvfptr(&obj, 2);
    f();
}

int main()
{
    Base base_obj;
    Concrete concrete_obj;
    cout << "override_demo:" << endl;
    override_demo(base_obj);
    override_demo(concrete_obj);
    cout << "override_demo2:" << endl;
    override_demo2(base_obj);
    override_demo2(concrete_obj);
}

这基本上是一个最简单的多态的演示了。我们先来看看 override_demo 这个函数。这个函数没有使用系统使用的多态功能，但是也实现了多态。

通过仔细分析可以发现，这个代码的原理是取出 Base 类的地址，如果，Base 定义了虚函数，那么会在Base的头部自动插入一个指针，指向虚表数组。

函数调用是通过函数的地址，编译器会在Base类里面插入这个虚表，里面填上按照顺序填上虚函数的地址，在子类中，会复制一份Base的虚表数组，

如果函数被重新定义，那么替换这个虚表中的函数地址，否则就用Base 类里面的地址，在调用虚函数的地方，把obj.vfunc1() 改成调用虚表中的第一个函数。

这样，即时子类指针转换成了父类指针，但是子类地址指针指向的虚表还是子类的，所以，会调用子类虚表中的第一个函数。

上面的解释太抽象，可以看看汇编的代码：

这是 override_demo2 的汇编代码，很能说明问题：

void override_demo2(Base &obj)
{
00411950 push        ebp
00411951 mov         ebp,esp
00411953 sub         esp,0C0h
00411959 push        ebx
0041195A push        esi
0041195B push        edi
0041195C lea         edi,[ebp-0C0h]
00411962 mov         ecx,30h
00411967 mov         eax,0CCCCCCCCh
0041196C rep stos    dword ptr es:[edi]
    obj.fun1();
0041196E mov         eax,dword ptr [obj] //取出obj的地址,就是getvfptr 中p的值
00411971 mov         edx,dword ptr [eax] //取出obj第一个元素的值，也就是 getvfptr 中的 *(ponit_t *)p , 取出指针所指向的地址
00411973 mov         esi,esp
00411975 mov         ecx,dword ptr [obj]
00411978 mov         eax,dword ptr [edx] //取出obj第一个元素的指针，指向的第一个元素，也就是 getvfptr 中的 q[0]
0041197A call        eax   //调用函数
0041197C cmp         esi,esp
0041197E call        @ILT+470(__RTC_CheckEsp) (4111DBh)
    obj.fun2();
00411983 mov         eax,dword ptr [obj]
00411986 mov         edx,dword ptr [eax]
00411988 mov         esi,esp
0041198A mov         ecx,dword ptr [obj]
0041198D mov         eax,dword ptr [edx+4] //第二个函数
00411990 call        eax
00411992 cmp         esi,esp
00411994 call        @ILT+470(__RTC_CheckEsp) (4111DBh)
    obj.fun3();
00411999 mov         eax,dword ptr [obj]
0041199C mov         edx,dword ptr [eax]
0041199E mov         esi,esp
004119A0 mov         ecx,dword ptr [obj]
004119A3 mov         eax,dword ptr [edx+8] //第三个函数
004119A6 call        eax
004119A8 cmp         esi,esp
004119AA call        @ILT+470(__RTC_CheckEsp) (4111DBh)
}

这样看来，调用虚函数的代码并不是很高，但是可以发现，虚函数是不可能内联的，因为，调用它必须通过地址。而且，在之类中必须声明为 virtual，

否则，这个函数不会放入虚表中，也就不能产生多态了。

依照这个思路，你可以改造成一个C语言的多态的方法。比如你定义一个基结构，它是一个函数指针列表，然后，定义几个子结构，子结构是和基结构一样排序

的函数指针列表。下面是一个例子：

代码

#include <stdio.h>
#include <stdlib.h>

typedef void func();
struct Base
{
    func *vfun1;
    func *vfun2;
    func *vfun3;
};

struct Child
{
    func *vfun1;
    func *vfun2;
    func *vfun3;
    char *hello;
};

void base_vfunc1()
{
    printf(" base_vfunc1\n");
}

void base_vfunc2()
{
    printf(" base_vfunc2\n");
}

void base_vfunc3()
{
    printf(" base_vfunc3\n");
}

struct Base* init_base()
{
    static struct Base base_vtable;
    base_vtable.vfun1 = base_vfunc1;
    base_vtable.vfun2 = base_vfunc2;
    base_vtable.vfun3 = base_vfunc3;
    return &base_vtable;
}

void child_vfunc3()
{
    printf(" child_vfunc3\n");
}
struct Child * init_child()
{
    struct Child *child;
    struct Base  *base_vtable;
    child = malloc(sizeof(struct Child));
    base_vtable = init_base();
    child->vfun1 = base_vtable->vfun1;
    child->vfun2 = base_vtable->vfun2;
    child->vfun3 = child_vfunc3;
    child->hello = "hello world";
    return child;
}

free_child(struct Child *ch)
{
    if (ch) free(ch);
    ch = NULL;
}

void override_demo(void *p)
{
    struct Base *base;
    base = (struct Base *)p;
    base->vfun1();
    base->vfun2();
    base->vfun3();
}

int main()
{
    struct Child *ch  = init_child();
    struct Base *base = init_base();
    printf("base\n");
    override_demo(base);
    printf("child\n");
    override_demo(ch);
    printf(ch->hello);
    free_child(ch);
}

这样，你写一个函数，可以调用不同的代码了。

当然，可能没有面向对象这样直观了。

posted @ 2011-01-20 14:01 暮夏阅读(741) 评论(0) 收藏举报

刷新页面返回顶部

多态的内幕--(C++, C)语言两个版本

公告