标签:
vector是单向开口的连续线性空间,用户只能在vector尾部进行插入删除操作,而 deque 是一种双向开口的连续线性空间,允许我们在头尾两端操作。
deque 和 vector 的最大差异在于:
deque提供的迭代器也是 RandomAccess Iterator,但它的迭代器并不是普通指针,其复杂度远远大于 vector 的迭代器,从而影响了各个运算层面。因此,除非必要,我们应尽可能选择使用 vector 而非 deque。对 deque 进行排序操作,为了最高效率,可将 deque 先完整的复制到一个 vector 身上,将 vector 排序后(利用 STL 的 sort 算法),在复制回 deque。
deque 是连续空间(逻辑上来看如此),连续线性空间总令我们联想到 array 或 vector。array 空间大小无法增长,vector 虽然可以增长,但只能在尾部扩张,而且这种增长是个假象:
如果不是 vector 每次配置新空间时都有留下一些备用空间,其增长将带来高昂的代价。
deque 是由一段一段的定量连续空间构成。一旦有必要在 deque 的前端或尾端增加新空间,便配置一段定量的连续空间,串接在 整个 deque 的头端或尾端。deque 的最大的任务便是在这些分段连续的空间上维护其整体连续的假象,并提供随机存取接口,避开了“重新配置、复制、释放”的轮回,代价则是复杂的迭代器架构。
deque 采用一块所谓的 map 作为主控,即中控器,这个所谓的 map 是一小块连续空间,其中每个元素都是一个指向另一段较大的连续空间的指针(也称节点),这段线性空间称为缓冲区。缓冲区是 deque 的存储空间主体。SGI STL 允许我们指定缓冲区大小,默认值 0 表示将使用 512 bytes 缓冲区。
template <class T, class Alloc = alloc, size_t BufSiz = 0>
class deque {
public: // Basic types
typedef T value_type;
typedef value_type* pointer;
...
protected: // Internal typedefs
typedef pointer* map_pointer;
protected: // Data members
...
map_pointer map; // 指向中控器 map,map 是块连续空间,其中每一个指针,指向一块缓冲区
size_type map_size; // map 可容纳的指针数
...
};
根据上述定义,可以发现 map 其实是一个 T**,即一个指针,所指之物也是一个指针,该指针指向型别为 T 的一块空间。
deque 是分段连续空间。维持其“整体连续”假象的任务,落在了迭代器的 operator++ 和 operator– 两个运算子身上。
deque 迭代器首先需要能够指出分段连续空间的位置,其次它必须能够判断自己是否处于其所在缓冲区边缘,如果是,一旦前进或后退时就必须跳跃至下一个或者上一个缓冲区。为了掌控缓冲区,deque 必须随时掌握中控器。实现如下:
inline size_t __deque_buf_size(size_t n, size_t sz)
{
return n != 0 ? n : (sz < 512 ? size_t(512 / sz) : size_t(1));
}
template <class T, class Ref, class Ptr, size_t BufSiz>
struct __deque_iterator {
typedef __deque_iterator<T, T&, T*, BufSiz> iterator;
typedef __deque_iterator<T, const T&, const T*, BufSiz> const_iterator;
static size_t buffer_size() {return __deque_buf_size(BufSiz, sizeof(T)); }
// 迭代器 5 个相应型别
typedef random_access_iterator_tag iterator_category; // 1
typedef T value_type; // 2
typedef Ptr pointer; // 3
typedef Ref reference; // 4
typedef size_t size_type;
typedef ptrdiff_t difference_type; // 5
typedef T** map_pointer;
typedef __deque_iterator self;
// 保持与容器的联结
T* cur; // 此迭代器所指缓冲区中当前元素
T* first; // 此迭代器所指缓冲区的头
T* last; // 此迭代器所指缓冲区的尾 (含备用空间)
map_pointer node; // 指向中控器
...
};
在 deque 数据结构中,含有两个迭代器:start 和 finish。start 的 cur 指向缓冲区的第一个元素,finish 的 cur 指向缓冲区的最后元素(的下一位置)。
以下是迭代器的几个关键行为。
由于迭代器内对各种指针运算都写进行了重载操作,所以各种指针运算如加、减、前进、后退都不能直观视之。其中最关键的是:一旦行进时遇到缓冲区边缘,要视前进、后退而定,可能需要调用 set_node() 跳一个缓冲区:
void set_node(map_pointer new_node) {
node = new_node;
first = *new_node;
last = first + difference_type(buffer_size());
}
以下是重载各个运算符的实现:
reference operator*() const { return *cur; }
pointer operator->() const { return &(operator*()); }
difference_type operator-(const self& x) const {
return difference_type(buffer_size()) * (node - x.node - 1) +
(cur - first) + (x.last - x.cur);
}
self& operator++() {
++cur;
if (cur == last) {
set_node(node + 1);
cur = first;
}
return *this;
}
self operator++(int) {
self tmp = *this;
++*this;
return tmp;
}
self& operator--() {
if (cur == first) {
set_node(node - 1);
cur = last;
}
--cur;
return *this;
}
self operator--(int) {
self tmp = *this;
--*this;
return tmp;
}
// 实现随机存取,迭代器可以直接跳跃 n 个距离
self& operator+=(difference_type n) {
difference_type offset = n + (cur - first);
// 目标位置在同一缓冲区
if (offset >= 0 && offset < difference_type(buffer_size()))
cur += n;
// 目标位置不在同一缓冲区
else {
difference_type node_offset =
offset > 0 ? offset / difference_type(buffer_size())
: -difference_type((-offset - 1) / buffer_size()) - 1;
// 切换至正确的节点(缓冲区)
set_node(node + node_offset);
// 切换至正确的元素
cur = first + (offset - node_offset * difference_type(buffer_size()));
}
return *this;
}
// 调用 operator+=
self operator+(difference_type n) const {
self tmp = *this;
return tmp += n;
}
// 调用 operator+=
self& operator-=(difference_type n) { return *this += -n; }
// 调用 operator-=
self operator-(difference_type n) const {
self tmp = *this;
return tmp -= n;
}
// 调用 operator*、operator+
reference operator[](difference_type n) const { return *(*this + n); }
bool operator==(const self& x) const { return cur == x.cur; }
bool operator!=(const self& x) const { return !(*this == x); }
bool operator<(const self& x) const {
return (node == x.node) ? (cur < x.cur) : (node < x.node);
}
前面提到 deque 除了维护一个指向 map 的指针外,还维护 start、finish 两个迭代器,分别指向第一个缓冲区的第一个元素和最后缓冲区的最后一个元素(的下一位置)。此外,它必须记住当前 map 大小,因为一旦 map 所提供的节点不足,就必须重新配置一块更大的 map。
template <class T, class Alloc = alloc, size_t BufSiz = 0>
class deque {
public: // Basic types
typedef T value_type;
typedef value_type* pointer;
typedef const value_type* const_pointer;
typedef value_type& reference;
typedef const value_type& const_reference;
typedef size_t size_type;
typedef ptrdiff_t difference_type;
public: // Iterators
typedef __deque_iterator<T, T&, T*, BufSiz> iterator;
typedef __deque_iterator<T, const T&, const T&, BufSiz> const_iterator;
protected: // Internal typedefs
// 元素的指针的指针
typedef pointer* map_pointer;
// 两个配置器
typedef simple_alloc<value_type, Alloc> data_allocator;
typedef simple_alloc<pointer, Alloc> map_allocator;
static size_type buffer_size() {
return __deque_buf_size(BufSiz, sizeof(value_type));
}
static size_type initial_map_size() { return 8; }
protected: // Data members
iterator start; // 指向第一个缓冲区
iterator finish; // 指向最后一个缓冲区
map_pointer map; // 指向 map,每个元素都指向一个指针
size_type map_size; // map 内的指针个数
...
};
根据上述定义,可完成下面函数:
public: // Basic accessors
iterator begin() { return start; }
iterator end() { return finish; }
const_iterator begin() const { return start; }
const_iterator end() const { return finish; }
// 调用__deque_iterator<>::operator[]
reference operator[](size_type n) { return start[difference_type(n)]; }
const_reference operator[](size_type n) const {
return start[difference_type(n)];
}
// 调用__deque_iterator<>::operator*
reference front() { return *start; }
reference back() {
iterator tmp = finish;
--tmp; // 调用 __deque_iterator<>::operator--
return *tmp; // 调用__deque_iterator<>::operator*
}
const_reference front() const { return *start; }
const_reference back() const {
const_iterator tmp = finish;
--tmp;
return *tmp;
}
size_type size() const { return finish - start;; }
size_type max_size() const { return size_type(-1); }
bool empty() const { return finish == start; }
deque 定义了两个专属的空间配置器:
protected: // Internal typedefs
typedef simple_alloc<value_type, Alloc> data_allocator;
typedef simple_alloc<pointer, Alloc> map_allocator;
还提供了各种构造函数,其中一个定义如下:
deque(size_type n, const value_type& value)
: start(), finish(), map(0), map_size(0)
{
fill_initialize(n, value);
}
其内调用的 fill_initialize() 负责产生并安排好 deque 的结构,并将元素的初值设定妥当:
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::fill_initialize(size_type n,
const value_type& value) {
create_map_and_nodes(n); // 把 deque 的结构都产生并安排好
map_pointer cur;
__STL_TRY {
// 为每个节点(缓冲区)设置初值
for (cur = start.node; cur < finish.node; ++cur)
uninitialized_fill(*cur, *cur + buffer_size(), value);
// 最后一个节点的设定稍有不同(尾端可能有备用空间,不必设定初值)
uninitialized_fill(finish.first, finish.cur, value);
}
# ifdef __STL_USE_EXCEPTIONS
catch(...) { // commit or rollback
for (map_pointer n = start.node; n < cur; ++n)
destroy(*n, *n + buffer_size());
destroy_map_and_nodes();
throw;
}
# endif /* __STL_USE_EXCEPTIONS */
}
其中,create_map_and_nodes 负责产生并安排好deque 的结构:
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::create_map_and_nodes(size_type num_elements) {
// 需要缓冲区数 = (元素个数/每个缓冲区可容纳元素个数)+ 1
// 若刚好整除,会多分配一个缓冲区
size_type num_nodes = num_elements / buffer_size() + 1;
// 一个 map 需要管理的节点数,最少 8 个,最多 “所需节点数” + 2
// 前后各预留一个
map_size = max(initial_map_size(), num_nodes + 2);
map = map_allocator::allocate(map_size);
// 以下令 nstart 和 nfinish 指向 map 所拥有之全部节点的最中央区段
// 保持在最中央,可使头尾两端的扩充能量一样大。每个节点可对应一个缓冲区
map_pointer nstart = map + (map_size - num_nodes) / 2;
map_pointer nfinish = nstart + num_nodes - 1;
map_pointer cur;
__STL_TRY {
// 为 map 内的每个现用节点配置缓冲区。
// 所有缓冲区加起来就是 deque 的可用空间(最后一个缓冲区可能留有一些备用空间)
for (cur = nstart; cur <= nfinish; ++cur)
*cur = allocate_node();
}
# ifdef __STL_USE_EXCEPTIONS
catch(...) { // commit or rollback
for (map_pointer n = nstart; n < cur; ++n)
deallocate_node(*n);
map_allocator::deallocate(map, map_size);
throw;
}
# endif /* __STL_USE_EXCEPTIONS */
// 为 deque 内的两个迭代器 start 和 finish 设定正确的值
start.set_node(nstart);
finish.set_node(nfinish);
start.cur = start.first;
finish.cur = finish.first + num_elements % buffer_size();
}
前面提到当 map 的备用空间不足,需要重新配置一块更大的 map,有两个函数来判断 map 什么时候需要重新配置:
void reserve_map_at_back (size_type nodes_to_add = 1) {
if (nodes_to_add + 1 > map_size - (finish.node - map))
// 如果 map 尾端的节点备用空间不足
// 符合上述条件则必须重新配置 map
reallocate_map(nodes_to_add, false);
}
void reserve_map_at_front (size_type nodes_to_add = 1) {
if (nodes_to_add > start.node - map)
// 如果 map 头端的节点备用空间不足
// 符合上述条件则必须重新配置 map
reallocate_map(nodes_to_add, true);
}
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::reallocate_map(size_type nodes_to_add,
bool add_at_front) {
size_type old_num_nodes = finish.node - start.node + 1;
size_type new_num_nodes = old_num_nodes + nodes_to_add;
map_pointer new_nstart;
if (map_size > 2 * new_num_nodes) {
new_nstart = map + (map_size - new_num_nodes) / 2
+ (add_at_front ? nodes_to_add : 0);
if (new_nstart < start.node)
copy(start.node, finish.node + 1, new_nstart);
else
copy_backward(start.node, finish.node + 1, new_nstart + old_num_nodes);
}
else {
size_type new_map_size = map_size + max(map_size, nodes_to_add) + 2;
// 配置一块空间,准备给新 map 使用
map_pointer new_map = map_allocator::allocate(new_map_size);
new_nstart = new_map + (new_map_size - new_num_nodes) / 2
+ (add_at_front ? nodes_to_add : 0);
// 把原 map 内容拷贝过来
copy(start.node, finish.node + 1, new_nstart);
// 释放原 map
map_allocator::deallocate(map, map_size);
// 设定新 map 的起始地址与大小
map = new_map;
map_size = new_map_size;
}
// 重新设定迭代器 start 和 finish
start.set_node(new_nstart);
finish.set_node(new_nstart + old_num_nodes - 1);
}
push_*、pop_*:
void push_back(const value_type& t) {
// 最后缓冲区有两个(或以上)备用空间
if (finish.cur != finish.last - 1) {
construct(finish.cur, t);
++finish.cur;
}
// 最后一个缓冲区只剩一个备用空间
else
push_back_aux(t);
}
void push_front(const value_type& t) {
// 第一个缓冲区有备用空间
if (start.cur != start.first) {
construct(start.cur - 1, t);
--start.cur;
}
// 第一个缓冲区已无备用空间
else
push_front_aux(t);
}
void pop_back() {
// 最后一个缓冲区有一个(或更多元素)
if (finish.cur != finish.first) {
--finish.cur;
destroy(finish.cur);
}
// 最后一个缓冲区没有任何元素
else
pop_back_aux();
}
void pop_front() {
// 第一个缓冲区有两个(或更多)元素
if (start.cur != start.last - 1) {
destroy(start.cur);
++start.cur;
}
// 第一个缓冲区只有一个元素
else
pop_front_aux();
}
在上述操作中,当操作发生在缓冲区边缘时,可能需要调用相应的函数:
// 当 finish.cur == finish.last - 1 时调用
// 最后缓冲区只有一个备用空间
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::push_back_aux(const value_type& t) {
value_type t_copy = t;
reserve_map_at_back(); // 符合某种条件则必须重换一个 map
*(finish.node + 1) = allocate_node(); // 配置一个新缓冲区
__STL_TRY {
construct(finish.cur, t_copy); // 在 finish.cur 处构造 t
finish.set_node(finish.node + 1); // 改变 finish,使其指向新缓冲区
finish.cur = finish.first; // 设定 finish 状态
}
__STL_UNWIND(deallocate_node(*(finish.node + 1)));
}
// 当 start.cur == start.first 时调用
// 第一个缓冲区没有备用空间
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::push_front_aux(const value_type& t) {
value_type t_copy = t;
reserve_map_at_front(); // 符合某种条件则必须重换一个 map
*(start.node - 1) = allocate_node(); // 配置一个新缓冲区
__STL_TRY {
start.set_node(start.node - 1); // 改变 start,使其指向新缓冲区
start.cur = start.last - 1; // 设定 start状态
construct(start.cur, t_copy); // 在 start.cur 处构造 t
}
# ifdef __STL_USE_EXCEPTIONS
catch(...) { // commit or rollback
start.set_node(start.node + 1);
start.cur = start.first;
deallocate_node(*(start.node - 1));
throw;
}
# endif /* __STL_USE_EXCEPTIONS */
}
// 当 finish.cur == finish.first 时调用
// 最后一个缓冲区没有任何元素
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>:: pop_back_aux() {
deallocate_node(finish.first);
finish.set_node(finish.node - 1);
finish.cur = finish.last - 1;
destroy(finish.cur);
}
// 当 start.cur == start.last - 1 时调用
// 第一缓冲区只有一个元素
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::pop_front_aux() {
destroy(start.cur);
deallocate_node(start.first);
start.set_node(start.node + 1);
start.cur = start.first;
}
clear,清空整个 deque,由于 deque 的最初状态(不含任何元素)保有一个缓冲区,因此 clear 完成之后要回到初始状态,即也保留一个缓冲区:
template <class T, class Alloc, size_t BufSize>
void deque<T, Alloc, BufSize>::clear() {
// 针对头尾以外的每一个缓冲区(他们一定是满的)
for (map_pointer node = start.node + 1; node < finish.node; ++node) {
// 调用 destroy 第二版本,析构所有元素
destroy(*node, *node + buffer_size());
// 释放缓冲区
data_allocator::deallocate(*node, buffer_size());
}
// 至少含有头尾两个缓冲区
if (start.node != finish.node) {
// 析构头缓冲区元素
destroy(start.cur, start.last);
// 析构尾缓冲区元素
destroy(finish.first, finish.cur);
// 释放尾缓冲区空间
data_allocator::deallocate(finish.first, buffer_size());
}
// 只有一个缓冲区,则不需要释放空间
else
destroy(start.cur, finish.cur);
finish = start; // 调整迭代器 finish
}
erase,用于清除某个元素:
// 清除 pos 所指的元素,pos 为清除点
iterator erase(iterator pos) {
iterator next = pos;
++next;
// 清除点之前的元素个数
difference_type index = pos - start;
// 若清除点之前的元素少,就移动清除点之前的元素
if (index < (size() >> 1)) {
copy_backward(start, pos, next); // 移动元素
pop_front(); // 移动完毕,最前一个元素冗余
}
// 若清除点之后的元素少,就移动清除点之后的元素
else {
copy(next, finish, pos); // 移动元素
pop_back(); // 移动完毕,最后一个元素冗余
}
return start + index;
}
erase 还有一个版本用于清除 [first, last) 区间内的所有元素:
template <class T, class Alloc, size_t BufSize>
deque<T, Alloc, BufSize>::iterator
deque<T, Alloc, BufSize>::erase(iterator first, iterator last) {
// 若清除的是整个 deque,直接调用 clear
if (first == start && last == finish) {
clear();
return finish;
}
else {
difference_type n = last - first; // 清除区间长度
difference_type elems_before = first - start; // 清除区间之前的元素个数
// 清除区间之前的元素个数较少
if (elems_before < (size() - n) / 2) {
copy_backward(start, first, last); // 移动元素
iterator new_start = start + n; // 新的头端
destroy(start, new_start); // 析构元素
// 释放空间
for (map_pointer cur = start.node; cur < new_start.node; ++cur)
data_allocator::deallocate(*cur, buffer_size());
start = new_start; // 设定新的头端
}
else {
copy(last, finish, first); // 移动元素
iterator new_finish = finish - n; // 新的尾端
destroy(new_finish, finish); // 析构元素
// 释放空间
for (map_pointer cur = new_finish.node + 1; cur <= finish.node; ++cur)
data_allocator::deallocate(*cur, buffer_size());
finish = new_finish; // 设定新的尾
}
return start + elems_before;
}
}
insert,在指定迭代器 pos 处插入值为 x 的节点:
iterator insert(iterator position, const value_type& x) {
// 在 deque 头端插入,调用 push_front
if (position.cur == start.cur) {
push_front(x);
return start;
}
// 在 deque 尾端插入,调用 push_back
else if (position.cur == finish.cur) {
push_back(x);
iterator tmp = finish;
--tmp;
return tmp;
}
// 在其他位置插入
else {
return insert_aux(position, x);
}
}
template <class T, class Alloc, size_t BufSize>
typename deque<T, Alloc, BufSize>::iterator
deque<T, Alloc, BufSize>::insert_aux(iterator pos, const value_type& x) {
// 插入点之前的元素个数
difference_type index = pos - start;
value_type x_copy = x;
// 插入点之前元素个数较少,则在头端插入
if (index < size() / 2) {
push_front(front());
iterator front1 = start;
++front1;
iterator front2 = front1;
++front2;
pos = start + index;
iterator pos1 = pos;
++pos1;
copy(front2, pos1, front1); // 元素移动
}
// 插入点之后元素个数较少,则在尾端插入
else {
push_back(back());
iterator back1 = finish;
--back1;
iterator back2 = back1;
--back2;
pos = start + index;
copy_backward(pos, back2, back1); // 元素移动
}
*pos = x_copy; // 设定新值
return pos;
}
stack 是一种先进后出的数据结构,只有一个开口,允许进行:新增元素、移除元素、取顶端元素等操作,不能进行迭代器访问操作。
在 SGI STL 的实现中,stack 内含一个 deque 成员,其完整实现如下:
template <class T, class Sequence = deque<T> >
class stack {
friend bool operator== __STL_NULL_TMPL_ARGS (const stack&, const stack&);
friend bool operator< __STL_NULL_TMPL_ARGS (const stack&, const stack&);
public:
typedef typename Sequence::value_type value_type;
typedef typename Sequence::size_type size_type;
typedef typename Sequence::reference reference;
typedef typename Sequence::const_reference const_reference;
protected:
Sequence c;
public:
bool empty() const { return c.empty(); }
size_type size() const { return c.size(); }
reference top() { return c.back(); }
const_reference top() const { return c.back(); }
void push(const value_type& x) { c.push_back(x); }
void pop() { c.pop_back(); }
};
template <class T, class Sequence>
bool operator==(const stack<T, Sequence>& x, const stack<T, Sequence>& y) {
return x.c == y.c;
}
template <class T, class Sequence>
bool operator<(const stack<T, Sequence>& x, const stack<T, Sequence>& y) {
return x.c < y.c;
}
queue 是一种先进先出的数据结构,只能在一端插入,另一端移除,允许进行:新增元素、移除元素、取首尾元素等操作,不能进行迭代器访问操作。
在 SGI STL 的实现中,queue 内含一个 deque 成员,其完整实现如下:
template <class T, class Sequence = deque<T> >
class queue {
friend bool operator== __STL_NULL_TMPL_ARGS (const queue& x, const queue& y);
friend bool operator< __STL_NULL_TMPL_ARGS (const queue& x, const queue& y);
public:
typedef typename Sequence::value_type value_type;
typedef typename Sequence::size_type size_type;
typedef typename Sequence::reference reference;
typedef typename Sequence::const_reference const_reference;
protected:
Sequence c;
public:
bool empty() const { return c.empty(); }
size_type size() const { return c.size(); }
reference front() { return c.front(); }
const_reference front() const { return c.front(); }
reference back() { return c.back(); }
const_reference back() const { return c.back(); }
void push(const value_type& x) { c.push_back(x); }
void pop() { c.pop_front(); }
};
template <class T, class Sequence>
bool operator==(const queue<T, Sequence>& x, const queue<T, Sequence>& y) {
return x.c == y.c;
}
template <class T, class Sequence>
bool operator<(const queue<T, Sequence>& x, const queue<T, Sequence>& y) {
return x.c < y.c;
}
STL 源码剖析读书笔记四:序列式容器之 deque、stack、queue
标签:
原文地址:http://blog.csdn.net/fool_duck/article/details/51439067