容器扩容之分摊时间复杂度分析

时间：2018-06-23 01:31:01 阅读：197 评论：0 收藏：0 [点我收藏+]

标签：这一操作系统预测估计 cap zed red 的区别动态

以向量vector为例分析动态扩容算法设计和时间复杂度分析

扩容算法实现

如何实现扩容，新的容量取多少合适？

对于容器内部数据区为数组的容器来说，动态扩容是必须的，因为无法预测容器规模的增长，而且必须保证数据区不仅在逻辑上连续分布存储，循秩访问，更要保证其在物理地址上的连续，因此每次插入操作前都需要询问是否需要扩容？

技术分享图片

如图2.1（c~e）我们需要申请一个更大容量的连续物理地址作为新的数据区域如数组B【】，然后将原数组的数据复制到新数据区域中（图d），此时才可以插入新元素e，最后，原数据区域的空间地址一定要释放掉归还给操作系统。

一种可行的算法实现如下

void Vector<T>::expand() //向量空间不足时扩容
{
if(_size<_capacity) //尚未满员时，不必扩容
return ;
if(_capacity<DEFAULT_CAPACITY) //不低于最小容量
_capacity=DEFAULT_CAPACITY;
T * _oldelem=_elem;
_elem=new T[_capacity<<1]; //容量加倍
for(int i=0;i<_size;i++) //复制原向量内容（T为基本类型，或者已经重载过"="运算符的自定义类型）
_elem[i]=_oldelem[i];
delete []oldelem; //释放原空间
}

由上述算法实现可以知道，新数组容量扩容至原数组容量的2倍！！

分摊分析

时间代价

可扩充向量和常规数组相比，其更加灵活，容量不受初始容量的限制，但是需要付出代价。插入操作的时间，在最坏情况下，每次扩容都是由n~2n，需要花费O(n)时间，看起来插入效率好像被拉低了，但是这是错觉。按照约定，每花费O(n)时间实施一次扩容，数组容量都会加倍，这意味着至少再需要经过n次插入操作，才会因为可能移除而在此扩容。即随着向量规模不断扩大，在执行插入操作过程之前需要进行扩容的概率将迅速降低，在某种平衡意义而言，用于扩容的时间成本不至于很高-----下面就是分摊时间复杂度的分析

分摊复杂度

对可扩充向量足够多次连续操作，并将期间所消耗的时间，分摊至所有的操作。如此分摊平均至每次操作的时间成本，称为分摊运行时间（amortized running time）。注意与平均时间复杂度（average running time）的区别：后者按照某种假定的概率分布，对各种情况下所需执行时间进行加权平均，也成为期望运行时间（expected running time）。而前者要求，参与分摊的操作必须构成和来自于一个真实可行的操作序列，而且该序列必须足够长。相对而言，分摊复杂度可以针对计算成本和效率做出更为客观而准确的估计。