从C++取地址操作看对象内存布局

对于一个C++对象，取地址存入一个指针，不同类型的指针拿到的值是一样的吗？

答案是不一定！

我们直接考察带虚函数的单继承和多继承两种场景。

测试样例

示例代码如下：

#include <stdio.h>
#include <stdint.h>

class A {
public:
    virtual void funA() {}
    int64_t a;
};
class B {
public:
    virtual void funB() {}
    int64_t b;
};
class C : public A {
public:
    virtual void funcC() {}
    int64_t c;
};
class D : public A, public B {
public:
    virtual void funD() {}
    int64_t d;
};

int main() {
    {
        C c;
        void *p = &c;
        A *a = &c;
        printf("%p %p %p %p %p\n", p, a, &(c.a), &c, &(c.c));
    }
    {
        D d;
        void *p = &d;
        A *a = &d;
        B *b = &d;
        printf("%p %p %p %p %p %p %p\n", p, a, &(d.a), b, &(d.b), &d, &(d.d));
    }
}

本机运行结果如下：

0x7fffe3d44ec0 0x7fffe3d44ec0 0x7fffe3d44ec8 0x7fffe3d44ec0 0x7fffe3d44ed0
0x7fffe3d44ec0 0x7fffe3d44ec0 0x7fffe3d44ec8 0x7fffe3d44ed0 0x7fffe3d44ed8 0x7fffe3d44ec0 0x7fffe3d44ee0

可以看到：

对于单继承，直接取地址、用父类型指针存地址，结果都是一样的；
对于多继承，直接取地址、用第一个父类型指针存地址，结果一样，用第二个父类型存地址结果不一样；

我们结合 gcc 和 clang 查看对象内存布局，进一步分析。

内存布局分析

使用 gcc -std=c++17 -fdump-class-hierarchy test-class-layout.cpp 命令，文件输出如下：

Vtable for A
A::_ZTV1A: 3 entries
0     (int (*)(...))0
8     (int (*)(...))0
16    (int (*)(...))A::funA

Class A
   size=16 align=8
   base size=16 base align=8
A (0x0x7f982b13e000) 0
    vptr=((& A::_ZTV1A) + 16)

Vtable for B
B::_ZTV1B: 3 entries
0     (int (*)(...))0
8     (int (*)(...))0
16    (int (*)(...))B::funB

Class B
   size=16 align=8
   base size=16 base align=8
B (0x0x7f982b13e0c0) 0
    vptr=((& B::_ZTV1B) + 16)

Vtable for C
C::_ZTV1C: 4 entries
0     (int (*)(...))0
8     (int (*)(...))0
16    (int (*)(...))A::funA
24    (int (*)(...))C::funcC

Class C
   size=24 align=8
   base size=24 base align=8
C (0x0x7f982af7d1a0) 0
    vptr=((& C::_ZTV1C) + 16)
  A (0x0x7f982b13e180) 0
      primary-for C (0x0x7f982af7d1a0)

Vtable for D
D::_ZTV1D: 7 entries
0     (int (*)(...))0
8     (int (*)(...))0
16    (int (*)(...))A::funA
24    (int (*)(...))D::funD
32    (int (*)(...))-16
40    (int (*)(...))0
48    (int (*)(...))B::funB

Class D
   size=40 align=8
   base size=40 base align=8
D (0x0x7f982af8e930) 0
    vptr=((& D::_ZTV1D) + 16)
  A (0x0x7f982b13e240) 0
      primary-for D (0x0x7f982af8e930)
  B (0x0x7f982b13e2a0) 16
      vptr=((& D::_ZTV1D) + 48)

使用 clang -Xclang -fdump-record-layouts test-class-layout.cpp 命令，终端输出如下：

*** Dumping AST Record Layout
         0 | class A
         0 |   (A vtable pointer)
         8 |   int64_t a
           | [sizeof=16, dsize=16, align=8,
           |  nvsize=16, nvalign=8]

*** Dumping AST Record Layout
         0 | class C
         0 |   class A (primary base)
         0 |     (A vtable pointer)
         8 |     int64_t a
        16 |   int64_t c
           | [sizeof=24, dsize=24, align=8,
           |  nvsize=24, nvalign=8]

*** Dumping AST Record Layout
         0 | class B
         0 |   (B vtable pointer)
         8 |   int64_t b
           | [sizeof=16, dsize=16, align=8,
           |  nvsize=16, nvalign=8]

*** Dumping AST Record Layout
         0 | class D
         0 |   class A (primary base)
         0 |     (A vtable pointer)
         8 |     int64_t a
        16 |   class B (base)
        16 |     (B vtable pointer)
        24 |     int64_t b
        32 |   int64_t d
           | [sizeof=40, dsize=40, align=8,
           |  nvsize=40, nvalign=8]

根据输出，可以得出类型D的内存布局情况：

+--------------+    <- ptrA, ptrD
|  vtable-A-D  |
+--------------+
|  members-A   |
+--------------+    <- ptrB
|  vtable-B    |
+--------------+
|  members-B   |
+--------------+
|  members-D   +
+--------------+

观察可以发现：

父类虚函数表和成员变量排放在子类成员变量之前；
从每个父类继承来的虚表和成员变量按照声明顺序依次排列，每个父类的虚表和成员变量紧密排列；
成员变量按照声明顺序依次排列；
子类型的虚函数追加在第一个父类的虚函数表尾部；
子类型地址存入不同父类指针时，指向各自类型对应的虚函数表位置；
直接获取子类型地址时，指向对象头部，也就是第一个虚函数表位置。

结论

可以看到，当使用父类指针操作子类对象时，指针指向父类虚函数表坐在偏移位置，此时内存分布和直接操作一个父类对象是一致的。
这种设计，尽可能保证了多态之下成员变量操作的效率。

扩展

会有什么问题吗？
有的！

考虑菱形继承，此时祖先类型的成员变量和虚函数会在子类型中重复出现！
这同样是出于上面所说的操作效率考虑，保证使用父类指针操作时，无论使用哪一个父类都能高效操作祖先类型的成员，因而必须在两个父类各自保存一份祖先类型的信息。

存在解决办法吗？存在。
如果是内存空间非常有限的情况，可以考虑使用虚继承，砍掉重复的成员；代价是操作效率会降低。
对比一下多继承和虚继承，前者时间高效空间低效，后者空间高效时间低效。

不过一般而言，空间都没有那么紧张，所以虚继承很少使用。事实上，就连多继承都是不提倡的，一般只使用单继承……

posted @ 2022-06-10 12:33 与MPI做斗争阅读(263) 评论(0) 收藏举报

刷新页面返回顶部

与MPI做斗争

从C++取地址操作看对象内存布局

从C++取地址操作看对象内存布局

测试样例

内存布局分析

结论

扩展

公告