警告. 本文有点技术难度,需要读者了解C++和一些汇编语言知识。
在本文中,我们解释由gcc编译器实现多继承和虚继承的对象的布局。虽然在理想的C++程序中不需要知道这些编译器内部细节,但不幸的是多重继承(特别是虚拟继承)的实现方式有各种各样的不太明确的结论(尤其是,关于向下转型指针,使用指向指针的指针,还有虚拟基类的构造方法的调用命令)。 如果你了解多重继承是如何实现的,你就能预见到这些结论并运用到你的代码中。而且,如果你关心性能,理解虚拟继承的开销也是非常有用的。最后,这很有趣。 :-)
class
Top
{
public
:
int
a;
};
class
Left
:
public
Top
{
public
:
int
b;
};
class
Right
:
public
Top
{
public
:
int
c;
};
class
Bottom
:
public
Left,
public
Right
{
public
:
int
d;
};
注意Top被继承了两次(在Eiffel语言中这被称作重复继承)。这意味着类型Bottom的一个实例bottom将有两个叫做a的元素(分别为bottom.Left::a和bottom.Right::a)。
这个布局的优点是,布局的第一部分与Left的布局重叠了,这样我们就可以很容易的通过一个Left指针访问 Bottom类。可是我们怎么处理
1
|
Right*
right = bottom; |
我们将哪个地址赋给right呢? 经过这个赋值,如果right是指向一个普通的Right对象,我们应该就能使用 right了。但是这是不可能的!Right本身的内存布局是完全不同的,这样我们就无法像访问一个"真正的"Right对象一样,来访问升级的Bottom对象。而且,也没有其它(简单的)可以正常运作的Bottom布局。
解决办法是复杂的。我们先给出解决方案,之后再来解释它。
你应该注意到了这个图中的两个地方。第一,字段的顺序是完全不同的(事实上,差不多是相反的)。第二,有几个vptr指针。这些属性是由编译器根据需要自动插入的(使用虚拟继承,或者使用虚拟函数的时候)。编译器也在构造器中插入了代码,来初始化这些指针。
如我们所见,将一个派生类的指针转换为一个父类的指针(或者说,向上转换)可能涉及到给指针增添一个偏移。有人可能会想了,这样向下转换(反方向的)就可以简单的通过减去同样的偏移来实现。确实,对非虚拟继承来说是这样的。可是,虚拟继承(毫不奇怪的!)带来了另一种复杂性。
假设我们像下面这个类这样扩展继承层次。
1
2
3
|
class AnotherBottom
: public Left, public Right { public : int e; int f; }; |
继承层次现在看起来是这样
现在考虑一下下面的代码。
1
2
3
4
5
|
Bottom*
bottom1 = new Bottom(); AnotherBottom*
bottom2 = new AnotherBottom(); Top*
top1 = bottom1; Top*
top2 = bottom2; Left*
left = static_cast <Left*>(top1); |
下图显示了Bottom和AnotherBottom的布局,而且在最后一个赋值后面显示了指向top的指针。
|
|
现在考虑一下怎么去实现从top1到left的静态转换,同时要想到,我们并不知道top1是否指向一个Bottom类型的对象,或者是指向一个AnotherBottom类型的对象。所以这办不到!这个重要的偏移依赖于top1运行时的类型(Bottom则20,AnotherBottom则24)。编译器将报错:
1
2
|
error:
cannot convert from base `Top ‘
to derived type `Left‘ via virtual base
`Top‘ |
因为我们需要运行时的信息,所以应该用一个动态转换来替代实现:
1
|
Left*
left = <b> dynamic_cast <</b>Left*<b>></b>(top1); |
可是,编译器仍然不满意:
1
2
|
error:
cannot dynamic_cast `top ‘
(of type `class Top*‘ )
to type ` class Left*‘
(source type is not polymorphic) |
(注:polymorphic多态的)
问题在于,动态转换(转换中使用到typeid)需要top1所指向对象的运行时类型信息。但是,如果你看看这张图,你就会发现,在top1指向的位置,我们仅仅只有一个integer (a)而已。编译器没有包含指向Top的虚拟指针,因为它不认为这是必需的。为了强制编译器包含进这个vptr指针,我们可以给Top增加一个虚拟的析构器:
1
2
3
|
<b> class </b>
Top {
<b> public </b>:
<span><b> virtual </b>
~Top() {}</span> <b> int </b>
a; }; |
这个修改需要指向Top的vptr指针。Bottom的新布局是
(当然类似的其它类也有一个新的指向Top的vptr指针)。现在编译器为动态转换插进了一个库调用:
1
|
left
= __dynamic_cast(top1, typeinfo_for_Top, typeinfo_for_Left, -1); |
这个函数__dynamic_cast定义在stdc++库中(相应的头文件是cxxabi.h);参数为Top的类型信息,Left和Bottom(通过vptr.Top),这个转换可以执行。 (参数 -1 标示出Left和Top之间的关系现在还是未知)。更多详细资料,请参考tinfo.cc 的具体实现 。
最后,我们来看看一些没了结的部分。
这里出现了一点令人迷惑的问题,但是如果你仔细思考下一的话它其实很简单。我们来看一个例子。假设使用上一节用到的类层次结构(向下类型转换).在前面的小节我们已经看到了它的结果:
1
2
|
Bottom*
b = <b> new </b>
Bottom(); Right*
r = b; |
1
2
|
Bottom**
bb = &b; Right**
rr = bb; |
编译器会接受这样的形式吗?我们快速测试一下,编译器会报错:
1
|
error:
invalid conversion from `Bottom** ‘
to `Right**‘ |
1
|
|
因此,bb和rr都指向b,并且b和r指向Bottom对象的正确的章节。现在考虑当我们赋值给*rr时会发生什么(注意*rr的类型时Right*,因此这个赋值是有效的):
1
|
*rr
= b; |
这样的赋值和上面的赋值给r在根本上是一致的。因此,编译器会用同样的方式实现它!特别地,它会在赋值给*rr之前将b的值调整8个字节。办事*rr指向的是b!我们再一次图示化这个结果:
只要我们通过*rr来访问Bottom对象这都是正确的,但是只要我们通过b自身来访问它,所有的内存引用都会有8个字节的偏移---明显这是个不理想的情况。
因此,总的来说,及时*a 和*b通过一些子类型相关,**aa和**bb却是不相关的。
编译器必须确保对象的所有虚指针都被正确的初始化。特别是,编译器确保了类的所有虚基类都被调用,并且只被调用一次。如果你不显示地调用虚拟超类(不管他们在继承层次结构中的距离有多远),编译器都会自动地插入调用他们缺省构造函数。
这样也会引来一些不可以预期的错误。以上面给出的类层次结构作为示例,并添加上构造函数的部分:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
<b> class </b>
Top {
<b> public </b>: Top()
{ a = -1; } Top(<b> int </b>
_a) { a = _a; } <b> int </b>
a; };
<b> class </b>
Left : <b> public </b>
Top {
<b> public </b>: Left()
{ b = -2; } Left(<b> int </b>
_a, <b> int </b>
_b) : Top(_a) { b = _b; } <b> int </b>
b; };
<b> class </b>
Right : <b> public </b>
Top {
<b> public </b>: Right()
{ c = -3; } Right(<b> int </b>
_a, <b> int </b>
_c) : Top(_a) { c = _c; } <b> int </b>
c; };
<b> class </b>
Bottom : <b> public </b>
Left, <b> public </b>
Right {
<b> public </b>: Bottom()
{ d = -4; } Bottom(<b> int </b>
_a, <b> int </b>
_b, <b> int </b>
_c, <b> int </b>
_d) : Left(_a, _b), Right(_a, _c) { d
= _d; }
<b> int </b>
d; }; |
1
2
3
|
Bottom
bottom(1,2,3,4); printf ( "%d
%d %d %d %d\n" ,
bottom.Left::a, bottom.Right::a, bottom.b,
bottom.c, bottom.d); |
1
|
1
1 2 3 4 |
1
|
-1
-1 2 3 4 |
1
2
3
4
|
Top::Top() Left::Left(1,2) Right::Right(1,3) Bottom::Bottom(1,2,3,4) |
为了避免这种情况,你应该显示的调用虚基类的构造函数:
1
2
3
4
|
Bottom( int _a, int _b, int _c, int _d):
Top(_a), Left(_a,_b), Right(_a,_c) { d
= _d; } |
C++ 多继承和虚继承的内存布局(Memory Layout for Multiple and Virtual Inheritance)
原文地址:http://blog.csdn.net/luguifang2011/article/details/42290475