标签:
STL 中的list 可以说是与vector 相对应的一个容器。
什么意思呢?
嗯,在我看来,vector 是线性表,空间连续,它的特点是原生指针作为它的迭代器,支持随机存取。但是插入和删除的操作代价高,并且有可能有一部分空间被浪费。
list 是链表,空间不连续,它的特点是对空间利用率高,插入和删除数据是常量时间,但是不支持随即存取,并且每个节点都需要浪费掉额外的两个指针的内存空间(不要忽视这点!)
注意,以上仅是个人的讨论,在数据结构中,线性表就是指抽象的连续数据的存储容器,实现一般分为数组和链表。
在三中讨论了vector 的实现,也说到STL 中的一些基础了,比如空间配置器、全局构造和析构函数、萃取技术、逆向迭代器等。这里就不再重复讲基础的东西,仅关注如何实现list
既然list 是链表,那么链表的节点肯定要定义一下的。
准确地说,list 是双向链表,它的节点有两个指针,一个指向后续节点,一个指向前驱节点。
于是,简洁明了的代码如下:
/** _list_node
*/
template<typename T>
struct _list_node
{
_list_node<T>* next;
_list_node<T>* prev;
T data;
};
以一个下划线开始的命名,表示仅在STL 的内部实现使用,不提供给客户使用(SGI 中的STL 是两个下划线开始)
SGI 中的STL 有点不一样,贴上代码:
template <class T>
struct __list_node {
typedef void* void_pointer;
void_pointer next; //这里使用了void指针
void_pointer prev;
T data;
};
它是用void* 来声明数据,我表示并不喜欢,就改成我实现的版本。
link_type 其实是一个typedef ,如下:
typedef _list_node<T> list_node;
typedef list_node* link_type;
这个typedef 在list 类中。(typedef 大法好)
弄明白这个之后,就可以往下看了。
前面说了,list 是双向链表,这个特性决定它可以很优美地定义自己的数据结构。
什么意思呢?
list 中仅有一个结点指针。
这很正常,链表都需要一个头指针。
然而,它将这个指针刻意指向一个空白的节点,这个节点表示链表的尾端。然后,它还是环状双向链表,所以尾端的next 指针指向链表的开头。
示意图如下:
(图像来源:参考资料[1] )
在设计链表时,预先安排一个空白结点是常见的手法,这样能够简化很多操作。仔细体会list 的操作,就能够感受到它的威力了。
在list 之中,有这样的代码:
link_type node;
//...
iterator begin()
{
return node->next; //或者iterator(node.next)
}
iterator end()
{
return node;
}
在list 中,数据的被包装在list_node 中,list_node的指针又被包装在迭代器中。
list 的数据操作仅支持双向移动,所以是双向迭代器(bidirectional iterator) 。
一开始不熟悉的时候,list_node 和link_type 老是被我搞混了。
在设计list 的迭代器的时候,应该谨记,不讨论迭代器的移动问题,迭代器的表现应该像一个原生指针。
迭代器的表现应该像一个原生指针。
迭代器的表现应该像一个原生指针。
有了信仰,那么可以实现了:
/** _list_iterator
*/
template<typename T, typename Ref, typename Ptr>
struct _list_iterator
{
typedef _list_iterator<T, T&, T*> iterator;
typedef _list_iterator<T, const T&, const T> const_iterator;
typedef _list_iterator<T, Ref, Ptr> self;
typedef T value_type;
typedef Ptr pointer;
typedef bidirectional_iterator_tag iterator_category;
typedef Ref reference;
typedef _list_node<T>* link_type;
typedef size_t size_type;
typedef ptrdiff_t difference_type;
link_type node;
_list_iterator() {}
_list_iterator(link_type inn) : node(inn) {}
_list_iterator(const iterator& x): node(x.node) { }
bool operator == (const self& x) const { return node == x.node; }
bool operator != (const self& x) const { return node != x.node; }
reference operator * () const { return node->data; }
pointer operator -> () const { return &(operator *() ); }
/** ++ -- operator
*/
self& operator ++ ()
{
node = node->next;
return *this;
}
self operator ++ (int)
{
self tmp(*this);
node = node->next;
return tmp;
}
self& operator -- ()
{
node = node->prev;
return *this;
}
self operator -- (int)
{
self tmp(*this);
node = node->prev;
return tmp;
}
};
operator* 应该是获得data 的引用
operator -> 应该是针对data 的操作。什么意思呢?比如当data 是一个指针时,-> 应该是在data 的值上操作,而不是迭代器的node 上操作。
为什么需要三个模板参数?因为要满足iterator 向 const_iterator 的隐式转换。
在list 中这么定义迭代器:
template<typename T, typename Alloc>
class list
{
//...
typedef _list_iterator<T, T&, T*> iterator;
typedef _list_iterator<T, const T&, const T*> const_iterator;
//...
};
在这样的情况下,以下代码是允许的:
iterator iter = begin();
const_iterator citer = iter; //发生隐式转换
简直 Amazing,我第一次知道原来还可以这么玩,牛逼。
而原生指针本身就支持non-const 到 const 的隐式转换,所以,迭代器的设计也是要支持的。
关于逆向迭代器,在vector 中,已经说明了reverse_iterator 的设计,这里直接套用就好了:
typedef _reverse_iterator<iterator> reverse_iterator;
typedef _reverse_iterator<const_iterator> const_reverse_iterator;
*const_reverse_iterator 也能向 reverse_iterator 隐式转换
虽然,list 的迭代器不支持opeartor + 和 operator - 的操作,但是却神奇地通过编译了。而且,即使通过萃取技术,拿到的也还是bidirectional_iterator_tag。
所以,只要我们不二逼地直接在reverse_iterator 上加减,就没有问题。(STL 提供了advance 函数进行迭代器的移动)
在直接开撸之前,先把几个重要的辅助函数写好。
事实证明,复杂问题可以通过几个简单的解合并到一起解决的。
get_node 是分配一个节点,而put_node 是解决一个节点(就是回收节点内存)
link_type get_node()
{
return list_node_alloc::allocate(1);
}
void put_node(link_type x)
{
list_node_alloc::deallocate(x);
}
create_node 是依据参数初始化一个节点,destroy_node 是销毁一个节点,在这个层面上讲,这个设计倒是和STL 中内存分配和对象构造分离异曲同工呀:
link_type create_node(const value_type& val)
{
link_type tmp = get_node();
XJ_TRY{
construct(&tmp->data, val);
}
XJ_CATCH
{
put_node(tmp);
}
return tmp;
}
void destroy_node(link_type x)
{
destroy(&x->data);
put_node(x);
}
注意到,这里也是使用了异常处理。(貌似在对象的构造中会使用异常处理)
transfer 函数是将某连续范围的元素迁移到某个特定的位置之前,它为其它的公有函数实现打下了良好的基础:
/** transfer :将[first,last) 的元素移到pos 之前
*/
void transfer(const_iterator pos, const_iterator first, const_iterator last)
{
//先处理next
pos.node->prev->next = first.node;
first.node->prev->next = last.node;
last.node->prev->next = pos.node;
//再处理prev
link_type tmp = last.node->prev;
last.node->prev = first.node->prev;
first.node->prev = pos.node->prev;
pos.node->prev = tmp;
}
逼逼了那么多,终于到开始实现接口的时候了。
insert 的插入操作直截了当。因为是链表,所以数据只能一个个的放进去。那么,其实只要把一个写好,其他的都写好了:
iterator insert(const_iterator pos, const value_type& val)
{
link_type tmp = create_node(val);
tmp->next = pos.node;
tmp->prev = pos.node->prev;
pos.node->prev->next = tmp;
pos.node->prev = tmp;
return tmp;
}
其他的insert 在上面这个基础上循环实现:
template<typename T, typename Alloc>
typename list<T, Alloc>::iterator list<T, Alloc>::insert(const_iterator pos, size_type n, const value_type& val)
{
iterator result;
while(n--)
result = insert(pos, val);
return result;
}
template<typename T, typename Alloc>
template<typename Input_iter>
typename list<T, Alloc>::iterator list<T,Alloc>::insert(const_iterator pos, Input_iter first, Input_iter last)
{
iterator result;
for(; first!=last; ++first)
result = insert(pos, *first);
return result;
}
erase 和 insert 是一个德性,小心一点编写就可以了:
iterator erase(const_iterator pos)
{
link_type next_node = pos.node->next;
link_type prev_node = pos.node->prev;
next_node->prev = prev_node;
prev_node->next = next_node;
destroy_node(pos.node);
return iterator(next_node);
}
iterator erase(const_iterator first, const_iterator last)
{
while( first != last) erase(first++); //要先自增才能去erase!!
return iterator(last.node);
}
为什么说要小心一点呢,因为如果在循环的那句写成这样就会出bug:
for(; first!=last; ++first)
erase(first);
仔细看迭代器的自增操作,当erase 之后,再自增,那么first 中node 的后继节点信息就失去了,还玩个卵。
merge 是将两个list 的数据合并到一块去,前提是两个list 要先经过排序:
template<typename T,typename Alloc>
void list<T, Alloc>::merge(list<T, Alloc>& x)
{
iterator first1 = begin();
iterator last1 = end();
iterator first2 = x.begin();
iterator last2 = x.end();
while(first1!=last1 && first2 != last2 )
{
if(*first2 < *first1)
{
iterator next = first2;
transfer(first1, first2, ++next);
first2 = next;
}
else ++first1;
}
if(first2!=last2)
transfer( last1, first2, last2);
}
template<typename T, typename Alloc>
template<typename Compare>
void list<T, Alloc>::merge(list<T, Alloc>& x, Compare comp)
{
iterator first1 = begin();
iterator last1 = end();
iterator first2 = x.begin();
iterator last2 = x.end();
while(first1!=last1 && first2 != last2 )
{
if(comp(*first2 ,*first1) )
{
iterator next = first2;
transfer(first1, first2, ++next);
first2 = next;
}
else ++first1;
}
if(first2!=last2)
transfer( last1, first2, last2);
}
这个想法就是想合并排序一样,一个一个得将它们放到合适的位置,
but ,我想到说,找到一段连续的区间再操作,而不是一个一个操作,代码如下,仅供参考:
template<typename T, typename Alloc>
void list<T, Alloc>::merge(list<T, Alloc>& x)
{
iterator curr_first = x.begin();
iterator curr_last = curr_first;
iterator first = this->begin();
while(curr_last != x.end() && first!=end() )
{
while(first!=end() && *first<=*curr_first) ++first;
while(curr_last != x.end() && *curr_last<=*first) ++curr_last;
if(first !=end() )
transfer(first, curr_first, curr_last);
else break;
curr_first = curr_last;
}
if(curr_last != x.end() )
transfer(end() , curr_last, x.end() );
}
unique 是将list 中连续的相同的数据去掉,只保留一个。
注意,是连续的,相同的。这意味着,先排序:)
template<typename T,typename Alloc>
void list<T, Alloc>::unique()
{
iterator first = begin();
iterator next = first;
++next;
while(next!=end() )
{
if(*first == *next)
{
erase(next++);
}
else ++first, ++next;
}
}
template<typename T,typename Alloc>
template<typename Binary_predicate>
void list<T, Alloc>::unique(Binary_predicate pred)
{
iterator first = begin();
iterator next = first;
++next;
while(next!=end() )
{
if( pred(*first, *next) )
{
erase(next++);
}
else ++first, ++next;
}
}
reverse 是反转链表的操作,面试经常问到的一个算法
template<typename T, typename Alloc>
void list<T, Alloc>::reverse()
{
link_type new_node = get_node();
new_node->next = new_node->prev = new_node;
iterator first = begin();
while(first!=end() )
{
link_type tmp = first.node;
++first;
new_node->next->prev = tmp;
tmp->next = new_node->next;
new_node->next = tmp;
tmp->prev = new_node;
}
put_node(node);
node = new_node;
}
以上是我自己是实现的,SGI 中的实现如下:
void list<T, Alloc>::reverse() {
if (node->next == node || link_type(node->next)->next == node) return;
iterator first = begin();
++first;
while (first != end()) {
iterator old = first;
++first;
transfer(begin(), old, first);
}
}
哪个更好?当然是标准的,没有涉及到额外的空间分配。但我不喜欢transfer 操作,它涉及到太多结点的操作。
splice 是将一个list 的数据分割到另一个list 中:
/** splice :将x 中的元素转移到this 中
@param pos :要插入的位置
*/
void splice(const_iterator pos, list& x)
{
if(!x.empty() )
transfer(pos, x.begin(), x.end() );
}
void splice(const_iterator pos, list&, iterator i)
{
iterator j(i);
++j;
if(pos == i || pos == j) return ;
transfer(pos, i, j);
}
void splice(const_iterator pos, list&, const_iterator first, const_iterator last)
{
if(first!=last)
transfer(pos, first, last);
}
sort 函数是个难搞的东西。list 的sort 算法有点厉害。
先上代码,再看运算过程:
/** sort
非常神奇的算法
*/
template<typename T, typename Alloc>
void list<T, Alloc>::sort()
{
//size ==0 || size ==1
if( node->next == node || node->next->next == node) return ;
list<T, Alloc> carry;
list<T, Alloc> counter[64];
int fill = 0;
while(!empty() )
{
carry.splice(carry.begin(), *this, begin() );
int i=0;
while(i<fill && !counter[i].empty() )
{
counter[i].merge(carry);
carry.swap(counter[i++]);
}
carry.swap(counter[i]);
if(i==fill)
++fill;
}
for(int i=1;i<fill; ++i)
counter[i].merge(counter[i-1]);
this->swap(counter[fill-1]);
}
template<typename T, typename Alloc>
template<typename Compare>
void list<T, Alloc>::sort(Compare comp)
{
//size ==0 || size ==1
if( node->next == node || node->next->next == node) return ;
list<T, Alloc> carry;
list<T, Alloc> counter[64];
int fill = 0;
while(!empty() )
{
carry.splice(carry.begin(), *this, begin() );
int i=0;
while(i<fill && !counter[i].empty() )
{
counter[i].merge(carry, comp);
carry.swap(counter[i++]);
}
carry.swap(counter[i]);
if(i==fill)
++fill;
}
for(int i=1;i<fill; ++i)
counter[i].merge(counter[i-1],comp);
this->swap(counter[fill-1]);
}
假设,现在有数据如下:
51 83 45 8 26
sort 的算法思想就是,每一轮将数据排序好,存放到counter 中。
counter[i] 存到的数据大小null 或者 2^(i) 个。
即
counter[0] : 1
counter[1] : 2
//。。。
carry 是每一轮数据的运输者,相当于给counter 传输数据的。
开始排序:
51 83 45 8 26
//1
counter[0] : 51;
counter[1] : null;
//2
counter[0] : null;
counter[1] : 51 83;
//3
counter[0] : 45;
counter[1] : 51 83;
//4
counter[0] : null;
counter[1] : null;
counter[2] : 8 45 51 83;
counter[3] : null;
//5
counter[0] : 26;
counter[1] : null;
counter[2] : 8 45 51 83;
counter[3] : null;
//6
//合并各个counter
这就像玩2048 一样,一点一点地往上合并。
一开始我还很好奇为什么会定义常数64呢?
现在看来,2^64 次方已经足够进行排序了。
[1] 说这个排序是快速排序,但又有资料说这个排序是合并排序。
我一时间也分不清究竟是哪个排序。
但是,这个排序算法无疑是出色的,空间复杂度为1,时间复杂度O(n*ln n);
swap 的编写,我之前专门写过一篇博客谈这个主题。在SGI 中,标准的做法就是这么做的。
定义一个成员swap 函数
/** swap
*/
void swap(list& x)
{
xj::swap(node,x.node);
}
全局swap 函数:
template<typename T, typename Alloc>
void swap(list<T, Alloc>& x, list<T, Alloc>& y)
{
x.swap(y);
}
–End–(我简直就是个话唠)
[参考资料]
[1] 侯捷. STL 源码剖析[M]. 华中科技大学出版社, 2002.
标签:
原文地址:http://blog.csdn.net/u014613043/article/details/51516724