在c++中,当一个类含有虚函数的时候,类就具有了多态性。构造函数的一项重要功能就是初始化vptr指针,这是保证多态性的关键步骤。
构造函数初始化vptr指针
下面是c++源码:
class X { private: int i; public: X(int ii) { i = ii; } virtual void set(int ii) {//虚函数 i = ii; } }; int main() { X x(1); }</div>
下面是对应的main函数汇编码:
_main PROC ; 16 : int main() { push ebp mov ebp, esp sub esp, 8;为对象x预留8byte空间 vptr指针占4字节 成员变量i占4byte ; 17 : X x(1); push 1;//将1压栈,作为参数传递给构造函数 lea ecx, DWORD PTR _x$[ebp];//获取x的首地址,即this指针,作为隐含参数传递给构造器 call ??0X@@QAE@H@Z ; 为x调用构造器 ; 18 : } xor eax, eax mov esp, ebp pop ebp ret 0 _main ENDP</div>
从汇编码可以看到,由于类X具有虚函数,main函数在栈上为对象x预留了8byte的空间,用来存放vptr指针和成员变量i。
下面是x的构造函数的汇编码:
??0X@@QAE@H@Z PROC ; X::X, COMDAT ; _this$ = ecx ; 5 : X(int ii) { push ebp mov ebp, esp push ecx;压栈ecx的目的是为了给this指针(x对象首地址)预留4byte的空间 mov DWORD PTR _this$[ebp], ecx;将this指针存储到刚才预留的空间里 ecx里面存放了x的首地址 mov eax, DWORD PTR _this$[ebp];将x的首地址给寄存器eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;将??_7X@@6B@的偏移地址(即vtable的首地址)放到x对象的首地址指向的内存储 这里就是初始化vptr指针 ; 6 : i = ii; mov ecx, DWORD PTR _this$[ebp];将x首地址给ecx mov edx, DWORD PTR _ii$[ebp];将参数ii的值给寄存器edx mov DWORD PTR [ecx+4], edx;将寄存器eax的值写入偏移x首地址4byte处的内存,即给x的成员变量i赋值 ; 7 : } mov eax, DWORD PTR _this$[ebp];将x对象首地址给寄存器eax,作为返回值。构造函数总是返回对象首地址 mov esp, ebp pop ebp ret 4 ??0X@@QAE@H@Z ENDP</div>
从代码中可以看出来,编译器确实暗中插入了代码,来用vtable的首地址初始化vptr指针,并且vptr指针位于对象首地址处。
如果类有继承关系,构造函数又如何初始化vptr指针呢?
下面是c++源码:
class X { private: int i; public: virtual void f() {} }; class Y : public X {//Y继承自X private: int j; }; int main() { Y y; }</div>
下面是main函数中的汇编码:
_main PROC ; 16 : int main() { push ebp mov ebp, esp sub esp, 12 ; 为对象y预留12 byte的空间 vptr指针4byte 父类成员变量4byte 子类成员变量4byte ; 17 : Y y; lea ecx, DWORD PTR _y$[ebp];获取对象y的首地址(即this指针),作为隐含参数传递给构造函数 call ??0Y@@QAE@XZ;调用y的构造函数 虽然y没有显示定义构造函数,但由于其含有虚成员函数,编译器提供默认构造函数 ; 18 : } xor eax, eax mov esp, ebp pop ebp ret 0 _main ENDP</div>
下面是子类构造函数汇编码:
??0Y@@QAE@XZ PROC ; Y::Y, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;//压栈ecx的目的是存放this指针 mov DWORD PTR _this$[ebp], ecx;将this指针(即对象首地址)放到刚才预留空间 ecx里面存放对象首地址 mov ecx, DWORD PTR _this$[ebp];将对象首地址给ecx 作为隐含参数传递给父类构造函数 call ??0X@@QAE@XZ;调用父类构造函数 mov eax, DWORD PTR _this$[ebp];将y的首地址给寄存器eax mov DWORD PTR [eax], OFFSET ??_7Y@@6B@;将y的vtable(??_7Y@@6B@)首地址赋给y对象首地址所指内存 即初始化子类vptr指针 mov eax, DWORD PTR _this$[ebp];将y首地址给eax,作为返回值。构造函数总是返回对象首地址 mov esp, ebp pop ebp ret 0 ??0Y@@QAE@XZ ENDP</div>
下面是父类构造函数汇编码:
??0X@@QAE@XZ PROC ; X::X, COMDAT ; _this$ = ecx push ebp mov ebp, esp push ecx;压栈的目的是为了存放this指针(父对象对象首地址)预留空间 mov DWORD PTR _this$[ebp], ecx;将父对象对象首地址(ecx中保存)放入刚才预留空间 mov eax, DWORD PTR _this$[ebp];将父对象首地址给寄存器eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;将vtable(??_7X@@6B@ 和子类不同)首地址赋给父对象首地址处的内存 即初始化父对象的vptr指针 mov eax, DWORD PTR _this$[ebp];将父对象的首地址传给eax,作为返回值。构造函数总是返回对象首地址 mov esp, ebp pop ebp ret 0 ??0X@@QAE@XZ ENDP</div>
从上面子类和父类的构造函数汇编码可以看出来,子对象包含父对象,在构造子对象的时候先构造父对象(子对象构造函数先调用父对象构造函数)。而且父对象的首地址和子对象的首地址一样(通过汇编码中ecx传递的值可以看出来),因此父对象和子对象的vptr指针位于同一处。所以,在构造对象的构成中,vptr指针先被初始化指向父对象的vtable首地址(在父对象构造函数中),最后又被初始化为指向子对象的vtable首地址(在子对象的构造函数中)。因此,在涉及继承的时候,vptr指针的值由最后调用的构造函数决定。
在构造函数调用虚函数机制失效,也就是说,在构造函数中调用虚函数总是本地版本(析构函数中也是一样)
c++源码如下:
class X { private: int i; public: virtual void f(int ii) { i = ii; } X() { f(1); } }; class Y : public X {//Y继承自X private: int j; public: virtual void f(int ii) { j = ii; } Y() { f(2); } }; int main() { Y y; }</div>
下面主要来看父类X和子类Y中的构造函数的汇编码:
子类Y的构造函数汇编码:
??0Y@@QAE@XZ PROC ; Y::Y, COMDAT ; _this$ = ecx ; 20 : Y() { push ebp mov ebp, esp push ecx;压栈的目的是为存放this指针(在ecx寄存器里面存放了子对象首地址)预留空间 mov DWORD PTR _this$[ebp], ecx;将子对象首地址存入刚才预留空间 mov ecx, DWORD PTR _this$[ebp];将子类首地址作为隐含参数传给父对象构造器(子对象首地址和父对象首地址一样) call ??0X@@QAE@XZ ; 调用父类构造器 mov eax, DWORD PTR _this$[ebp];将子对象首地址传给寄存器eax mov DWORD PTR [eax], OFFSET ??_7Y@@6B@;将子对象的vtable首地址存到子对象首地址所指向的内存,即初始化子对象的vptr指针 ; 21 : f(2); push 2;将2压栈,作为参数调用函数f,这里,子对象调用的是自己的函数f mov ecx, DWORD PTR _this$[ebp];将子对象首地址传给ecx,作为隐含参数传递给成员函数f call ?f@Y@@UAEXH@Z ; 调用子对象中的f函数 ; 22 : } mov eax, DWORD PTR _this$[ebp];将子对象首地址给寄存器eax,作为返回值。构造器总是返回对象首地址 mov esp, ebp pop ebp ret 0 ??0Y@@QAE@XZ ENDP ; Y::Y</div>
父类X构造函数的汇编码:
??0X@@QAE@XZ PROC ; X::X, COMDAT ; _this$ = ecx ; 8 : X() { push ebp mov ebp, esp push ecx;压栈的目的是存放父对象首地址预留空间 父对象首地址和子对象首地址一样 mov DWORD PTR _this$[ebp], ecx;ecx里面存放父对象首地址,传给刚才预留的空间 mov eax, DWORD PTR _this$[ebp];将父对象首地址传给eax mov DWORD PTR [eax], OFFSET ??_7X@@6B@;将父对象的vtable首地址写入父对象首地址所指向的内存 即初始化父对象的vptr指针 ; 9 : f(1); push 1;将1压栈,作为参数调用函数f 这里调用时父对象的版本 mov ecx, DWORD PTR _this$[ebp];将父对象首地址作为隐含参数传给f call ?f@X@@UAEXH@Z ; 调用函数f ; 10 : } mov eax, DWORD PTR _this$[ebp];将父对象首地址传给eax作为返回值。构造函数总是返回对象首地址 mov esp, ebp pop ebp ret 0 ??0X@@QAE@XZ ENDP</div>
从汇编码中可以看到,构造函数中确