C# 的new操作符导致CLR执行以下操作:
1、计算类型的字段(以及从基类型继承的字段)所需要的字节数。
2、加上对象的开销所需的字节数。每个对象都有两个开销字段:类型对象指针和同步块索引。对于32位应用程序,这两个字段各需要32位,所以每个对象需要增加8字节。对于64位应用程序,这两个字段各需要64位,所以每个对象要增加16字节。
3、CLR检查区域中是否有分配对象所需的字节数。如果托管堆有足够的可用空间,就在NetxObjPtr指针指向的地址处放入对象,为对象分配的字节会被清零。接着调用类型的构造器(为this参数传递NextObjPtr),new操作符返回对象引用。就在返回这个对象引用之前,NextObjPtr指针的值会加上这个对象占用的字节数来得到一个新值,即下个对象放入托管堆时的地址。如下图:
垃圾回收算法
CLR使用引用跟踪算法。引用跟踪算法只关心引用类型的变量,因为只有这种变量才能引用堆上面的对象;值类型变量直接包含值类型实例。引用类型变量可在许多场合使用,包括类的静态和实例字段,或者方法的参数和局部变量。这里我们将所有引用类型的变量都称为根。
CLR开始GC时,首先暂停所有的线程。(这样可以防止线程在CLR检查期间访问对象并更改其状态。) 然后CLR进入GC标记阶段。在这个阶段,CLR遍历堆中的所有对象,将同步块索引字段中的一位设为0。这表明所有的对象都应删除。然后,CLR检查所有的活动根,查看他们引用了哪些对象。这正是CLR的GC被称作引用跟踪GC的原因。如果一个根包含null,CLR忽略这个根并继续检查下一个根。
下图展示一个堆,其中包含几个对象。
应用程序的根直接引用对象A 、C、D 、F。所有的对象都已经被标记。标记对象D时,GC发现这个对象含有一个引用对象H的字段,造成对象H也被标记。标记过程会持续,直至应用程序的所有根所有检查完毕。
检查完毕后,堆中的对象要么已标记,要么未标记。已标记的对象不能被垃圾回收,因为至少有一个根在引用它。我们说这种对象是可达的,因为应用程序可以通过引用它的变量抵达它。 未标记的对象是不可达的,因为应用程序中不存在使对象能被再次访问的根。
CLR知道哪些对象可以幸存,哪些可以被删除后,进入GC的压缩(类似于碎片整理)阶段。在压缩阶段,CLR对堆中已标记的对象进行“乾坤大挪移”,整理所有幸存下来的对象,使他们占用连续的内存。这样做的好处在于:1、所有幸存对象在内存中紧挨在一起,恢复了引用的“局部性”,减少了应用程序的工作集,从而提升了将来访问这些对象时的性能;2、经过整理后,可用空间也是连续的,整个地址空间区段得到了解放,允许其他东西进驻。
在内存中移动了对象之后有一个问题亟待解决。引用幸存对象的根现在引用的还是对象最初在内存中的位置,而非移动后的位置。被暂停的线程恢复执行时,将访问旧的内存位置,会造成内存损坏。 这显然是不能容忍的,所以作为压缩阶段的一部分,CLR还要从每个根减去所引用对象在内存中偏移的字节数。这样就能保证每个根还是引用和之前一样的对象,只是对象在内存中变换了位置。
如图:
代:提升性能 (待续)
引自:《CLR VIA C# -21章》