深度探索C++对象模型

深度探索C++对象模型

  • 什么是C++对象模型:
    • 语言中直接支持面向对象程序设计的部分.
    • 对于各个支持的底层实现机制.
  • 抽象性与实际性之间找出平衡点, 需要知识, 经验以及许多思考.

导读

  • 这本书是C++第一套编译器cfront的设计者所写.
  • 了解C++对象模型, 有助于在语言本身以及面向对象观念两方面层次提升.
    • explicit(明确出现于C++程序代码).
    • implicit(隐藏于程序代码背后).

关于对象

  • 每个非内联(non-inline)成员函数只会诞生一个函数实例. 而内联函数会在每个使用者身上产生一个函数实例.
  • C++在布局以及存取时间上的额外负担主要由虚(virtual)引起的:
    • 虚函数机制(virtual function)用于支持一个有效率的运行期绑定(runtime binding).
    • 虚基类(virtual base class) 用以实现多次出现在继承体系中的基类, 有一个单一而被共享的实例.
    • 额外负担, 派生类转换.
  • 在C++中, 有两种类数据成员: 静态(static) 和非静态(non-static).
    • 三种类成员函数: 静态(static), 非静态(non-static)和虚函数(virtual).
  • 每个数据成员或成员函数都有自己的一个slot(元素, 位置, 槽) --- 针对vtbl(虚表)而言.
  • 成员函数表(member function table)成为了支持虚函数(virtual function)的一个有效方案.

C++对象模型

  • 非静态数据成员被置于每一个类对象中, 静态数据成员被存放在个别的类对象之外.
    • 静态和非静态函数也被存放在个别的类对象之外.
    • 虚函数利用虚表(vbtl)和虚表指针(vptr)设置.
      • 每个类产生一堆指向虚函数的指针, 并放到表格之中.
      • 每个类对象被安插一个指针, 指向相关的virtual table(虚表).
        • vptr的设定与重置都由每一个类的构造, 析构和copy赋值运算符自动完成.
      • 每个类的type_info(类型信息)的对象也由虚表(virtual table)指出, 通常放在表格的第一个槽(slot).
        C++对象模型
  • 在虚拟继承的情况下, 基类不管在继承串链中被派生多少次, 永远只会存在一个实例.
  • class不仅是一个关键字, 它还会引入它所支持的封装和继承的哲学.
  • 某种意义上, 在C++中struct和class这两个关键字是可以互换的.
  • 基类和派生类的数据成员的布局没有谁先谁后的强制规定, 但使用初始化列表时, 必须保持成员变量顺序的一致性.
  • 组合而非继承, 才是把C和C++结合在一起的唯一可行方法.

对象的差异性

  • 三种程序设计范式:
    • 程序模型.
    • 抽象数据类型(基于对象).
    • 面向对象模型.
    • 应该还有一个模板编程(范式模型).
  • 只有通过指针或引用的间接处理基类对象, 才支持面向对象程序设计所需的多态性质.
  • C++中, 多态只存在与public 类体系中, nonpublic的派生行为和void*的指针的多态性, 必须由程序员来显式管理.
    • 隐式转换操作: 把一个派生类的指针转换为一个指向public基类类型的指针.
    • 由虚函数(virtual function)机制: ps->rotate();.
    • 由dynamic_cast和typeid运算符转换: dynamic_cast<base_class *> (derived_class *);.
  • 多态的主要用途是经由一个共同的接口来影响类型的封装, 这个接口一般定义在一个抽象的基类中.
  • 一个指针, 不管它指向那种数据类型, 其本身所需内存大小是固定的, 与计算机的位数一致.
  • 指针类型会教导编译器如何解释某个特定地址中的内存内容及其大小.
  • void*指针能够持有一个地址, 但不能通过 它来操作所指对象, 因为不知道其覆盖怎样的地址空间.
  • 派生类不会新添加虚表指针(vptr, 继续使用基类的指针), 只是覆盖的地址会有所不同.
  • 类型信息的封装并不是维护于指针之中, 而是维护于链接(link)之中, 此链接存在于对象的虚表指针(vptr), 和vptr所指的虚表(virtual table)之间.
  • 编译器必须确保每个对象有一个或一个以上的vptr, 这些vptr的内容不会被基类对象初始化或改变.
  • 一个指针或引用之所以支持多态, 是因为它们并不引发内存中任何与内存相关的内存委托操作, 会改变的只有他们所指内存的"大小和内容解释方式"而已.
  • 将派生类直接用于初始化基类对象时, 派生类对象会被切割以塞入较小的基类类型内存中.
  • C++通过指针(pointer)和引用(reference)来支持多态.

构造函数语义

  • 默认构造函数的构造操作:
    • 会插入一些构造函数的代码.
  • 编译器为未声明任何构造的类, 编译器会为他们合成一个默认的构造函数.
  • 被合成出来的构造函数只满足编译器的需要.
    • 合成的默认构造函数中, 只有基类派生对象成员类对象会被初始化.
    • 所有其他非静态数据成员(如整数, 整数指针, 整数数组等)都不会被初始化.
  • copy 构造函数的构造操作:
    • 默认成员初始化列表, 类似于深拷贝(bitwise copy).
    • 默认构造函数和默认copy构造函数在必要时才由编译器产生出来.
  • 一个类对象可以通过两种方式复制得到, 一种是被初始化(copy constructor), 另一种是被指定(copy assignment operator).
  • 位逐次拷贝(bitwise copy semantics(语义)):
    • 会拷贝每一个位(bit).
  • 什么时候不要位逐次拷贝:
    • 当类内含一个成员对象, 该成员对象中声明了一个copy 构造函数.
    • 类继承的基类中存在一个构造函数.
    • 类声明了一个或多个虚函数.
    • 当类派生自一个继承串连, 其中有一个或多个虚基类时.
  • 当编译器导入一个虚表指针(vptr)到一个类对象中时, 该类就不展现逐次语义(bitwise semantics)了.

程序转换语义(Program Transformation Semantics)

  • 显示的初始化操作(Explicit Initialization):
    • 程序转换有两个阶段:
      • 重写一个定义, 其中的初始化操作会被剥离.
      • 类的copy 构造调用操作会被安插进去.
  • 编译器可能做NRV(Named Return Value)优化操作.
  • 以一个类对象作为另一个类对象的初值的情形, C++允许编译器有大量的自由发挥空间, 以提升程序效率.
  • 必须使用成员初始化列表(member initialization list):
    • 当初始化一个成员引用(reference member)时.
    • 当初始化一个常量成员(const member)时.
    • 当调用一个基类的构造函数, 而该基类拥有一组参数时.
    • 当调用一个成员类的构造函数, 其拥有一组参数时.
  • 编译器会一一操作初始化列表(initialization list), 以适当顺序在构造函数之内安插初始化操作, 在显式之前.
    • 初始化列表中的顺序是由类的成员声明顺序决定的, 不是由初始化列表中的排列顺序决定的.
    • 顺序混乱会造成意想不到的危险.
    • 初始化列表中的项目被放在显示声明代码(explicit user code)之前.

Data语义

  • 一个空类会被编译器安插一个char, 使这个类的两个对象得以在内存中配置独一无二的地址.
  • 空虚基类(Empty virtual base class)已经称为C++面向对象的一个特有术语.
    • 提供了一个虚拟接口, 没有任何数据, 空虚基类被认为是派生对象开头的一部分, 不花费任何派生类的额外空间.
  • 虚基类自读爱香只会在派生类中存在一份实例, 不管它在class继承体系中出现了多少次.
  • 非静态成员数据放置的是个别类对象感兴趣的数据, 静态成员数据放置的是整个类感兴趣的数据.
    • 静态成员变量被放到全局数据段中, 不会影响个别类对象的大小. 不管生成多少个对象, 静态数据成员永远只存在一份实例.
    • 编译器自动加上额外的数据成员, 用以支持某些语言特性.
    • 因为内存对齐(alignment), 边界调整的需要. --- 类对象可能比想象的大.

数据成员的布局

  • 成员变量的排列顺序因编译器而异, 编译器可以随意选一个放在第一个.
  • 在C++中, 在同一access section(private, protected, public等区段)中, 成员的排列只需符合较晚出现的成员变量在类对象中有较高的地址.
  • 静态成员并不需要通过类对象进行访问.
    • 一个静态数据成员的地址是一个指向其数据类型的指针, 并不是一个指向类成员的指针.
  • 对一个非静态数据成员进行存取操作, 编译器需要把类对象的起始地址加上数据成员的偏移位置(offset).
    • 每个非静态数据成员的偏移位置(offset)在编译时期即可知晓.
  • 具体继承(concrete inheritance)并不会增加空间和存取时间上的额外负担.
  • 在每一个类对象(class object)中带入一个vptr, 提供执行期的链接, 使每一个object(对象)能够找到对应的虚表(虚virtual table).
    • 在派生类和基类中, 可能重新设定vptr的值.
      在析构函数中, 可能抹消掉指向类相关虚表(virtual table)的vptr.
  • vptr放在类对象的前端(起始处), 会丧失对C语言的兼容性.
  • 多重继承的问题主要发生于派生类对象和其第二或后继的基类对象之间的转换.
  • 取一个非静态数据成员的地址, 将得到它在类中的偏移量(offset); 取一个绑定于真正类对象身上的数据成员的地址, 将会得到该成员在内存中的真正地址.

函数(Function)语义

  • 静态成员函数:
    • 不能直接存取非静态成员数据.
    • 也不能被声明为const函数.
  • 一般而言, 成员的名称前面会被加上类名称, 以形成独一无二的命名.
  • 静态成员函数没有this指针.
  • 在C++中, 多态(polymorphsim)表示以一个public base class(公有基类)的指针(或引用), 寻址一个派生类对象.
    • 多态机能主要扮演一个传送机制的角色, 可以在程序任何地方采用一组public derived类型.
    • 有了RTTI(runtime tyoe identification)就能够在执行期查询一个多态的指针或多态的引用.
  • 虚拟继承是C++中多重继承中特有的概念, 虚拟继承的一些总结.
  • 深入探索C++对象模型笔记汇总

  • 内联(inline)函数中的局部变量, 再加上有副作用的参数, 可能会导致大量临时性的对象产生.

构造, 析构, 拷贝语义

  • 继承体系中每一个类对象的析构函数都会被调用.
  • 构造函数可能内含大量的隐藏diamante, 因为编译器会扩充每一个constructor, 扩充成都视class 的继承体系而定.
    • 记录在成员初始化列表中的数据成员初始化操作会被放进构造函数本体, 并以成员变量声明顺序为顺序.
    • 如果有一个成员变量没有出现在初始化列表中, 它有一个默认的构造函数, 那么该默认的构造函数必须被调用.
    • 类对象的虚表指针(virtual table pointer)必须被设置初值, 指向适当的虚表(virtual table).
    • 基类的构造函数必须被调用, 以基类的声明顺序为顺序.
    • 虚基类构造函数必须被调用, 从左到右, 从最深到最浅.
  • 如果类没有定义析构函数, 只有在类内的成员对象(基类)拥有析构函数时, 编译器才会自动合成一个出来.

执行期语意

  • C++所有的全局对象都被繁殖在程序的数据段(data segment)中.
  • 运算符new一般由两个步骤完成:
    • 通过适当的new运算符函数实例, 配置所需的内存.
    • 将配置来的对象设立初值.
  • 临时对象的摧毁应该是对完整表达式(full-expression)求值过程中的最后一个步骤.
    • 完整表达式(full-expression)是表达式最外围的那个.
  • 编译器不能消除class类型的局部临时变量, 因为C++back-ends的限制.
    • 可以通过一些优化工具把临时对象放进寄存器.

站在对象模型的尖端

  • 模板template, 异常处理exception handing(EH), 运行时类型识别(runtime type identification, RTTI).
  • 每一个可执行文件中只需要一份模板的实例, 每个编译单位都会拥有一份实例.
  • 只有在成员函数被使用的时候, C++标准才要求他们被实例化.
    • 空间和时间效率的考虑.
    • 尚未实现的机能.
  • 所有与类型相关的检验, 如果牵涉到template参数, 都必须延迟到真正的实例化操作(instantiation)发生, 才得为之.
  • Template中的名称决议法:
    • 定义模板(template)的程序端和实例化模板(template)的程序的区别.
    • 定义模板(template)专注于一般的模板类.
    • 实例化模板(template)专注于特定的实例.
  • 如果一个虚函数被实例化, 其实例化点紧跟在其类的实例化点之后.
  • dynamic_cast运算符可以再执行期决定真正的类型.
  • typeud运算符传回一个const reference, 类型为type_info.
  • 虽然RTTI只适用于多态类(polymorphic classes), 事实上type_info对象也适用于内建类型, 以及非多态的使用者自定义类型.
  • 动态共享函数库, 共享内存.
posted @ 2019-04-26 22:56 coding-for-self 阅读(...) 评论(...) 编辑 收藏