最近在项目开发中,遇到一个异常,经过测试,发现是迭代器失效问题,于是稍微总结了一下。
vector迭代器失效测试:
测试程序:
void vectorTest()
{
vector<int> container;
for (int i = 0; i < 10; i++)
{
container.push_back(i);
}
vector<int>::iterator iter;
for (iter = container.begin(); iter != container.end(); iter++)
{
if (*iter > 3)
container.erase(iter);
}
for (iter = container.begin(); iter != container.end(); iter++)
{
cout<<*iter<<endl;
}
}
测试结果如下:
结果对吗?肯定不对,结果应该是0,1,2,3。
在看看跟进去之后的报错情况:
迭代器在执行++操作时报错!
对于序列式容器,比如vector,删除当前的iterator会使后面所有元素的iterator都失效。这是因为顺序容器内存是连续分配,删除
一个元素导致后面所有的元素会向前移动一个位置。但是erase方法可以返回下一个有效的iterator。所以代码做如下修改,就OK了。
void vectorTest()
{
vector<int> container;
for (int i = 0; i < 10; i++)
{
container.push_back(i);
}
vector<int>::iterator iter;
for (iter = container.begin(); iter != container.end(); )
{
if (*iter > 3)
iter = container.erase(iter); //erase的返回值是删除元素下一个元素的迭代器
else{
iter++;
}
}
for (iter = container.begin(); iter != container.end(); iter++)
{
cout<<*iter<<endl;
}
}
运行结果如下:
结果是正确的。
再看一个MAP的示例,
void mapTest()
{
map<int, string> dataMap;
for (int i = 0; i < 100; i++)
{
string strValue = "Hello, World";
stringstream ss;
ss<<i;
string tmpStrCount;
ss>>tmpStrCount;
strValue += tmpStrCount;
dataMap.insert(make_pair(i, strValue));
}
cout<<"MAP元素内容为:"<<endl;
map<int, string>::iterator iter;
for (iter = dataMap.begin(); iter != dataMap.end(); iter++)
{
int nKey = iter->first;
string strValue = iter->second;
cout<<strValue<<endl;
}
cout<<"内容开始删除:"<<endl;
/////////////////////////////////////////////擦除操作引发迭代器失效
for (iter = dataMap.begin(); iter != dataMap.end(); iter++)
{
int nKey = iter->first;
string strValue = iter->second;
if (nKey % 2 == 0)
{
dataMap.erase(iter);
}
cout<<iter->second<<endl;
}
}
结果报错:
看看报异常时跟进去在哪里报错:
根据迭代器访问数据时失效! map/set iterator
not dereferencable
迭代器是不引用的。
正确的做法是:
void mapTest()
{
map<int, string> dataMap;
for (int i = 0; i < 100; i++)
{
string strValue = "Hello, World";
stringstream ss;
ss<<i;
string tmpStrCount;
ss>>tmpStrCount;
strValue += tmpStrCount;
dataMap.insert(make_pair(i, strValue));
}
cout<<"MAP元素内容为:"<<endl;
map<int, string>::iterator iter;
for (iter = dataMap.begin(); iter != dataMap.end(); iter++)
{
int nKey = iter->first;
string strValue = iter->second;
cout<<strValue<<endl;
}
cout<<"内容开始删除:"<<endl;
for (iter = dataMap.begin(); iter != dataMap.end(); )
{
int nKey = iter->first;
string strValue = iter->second;
if (nKey % 2 == 0)
{
dataMap.erase(iter++);
}else
{
iter++;
}
if (iter != dataMap.end())
cout<<iter->second<<endl;
}
最后输出结果:
程序在一边删除一遍输出,而且能够顺利输出结束。
总结一下:
vector是一个顺序容器,在内存中是一块连续的内存,当删除一个元素后,内存中的数据会发生移动,以保证数据的紧凑。所以删除一个数据后,其他数据的地址发生了变化,之前获取的迭代器根据原有的信息就访问不到正确的数据。
所以为了防止vector迭代器失效,常用如下方法:
for (iter = container.begin(); iter != container.end(); )
{
if (*iter > 3)
iter = container.erase(iter); //erase的返回值是删除元素下一个元素的迭代器
else{
iter++;
}
}
这样删除后iter指向的元素后,返回的是下一个元素的迭代器,这个迭代器是vector内存调整过后新的有效的迭代器。万无一失!
map是关联容器,以红黑树或者平衡二叉树组织数据,虽然删除了一个元素,整棵树也会调整,以符合红黑树或者二叉树的规范,但是单个节点在内存中的地址没有变化,变化的是各节点之间的指向关系。
所以在map中为了防止迭代器失效,在有删除操作时,常用如下方法:
for (iter = dataMap.begin(); iter != dataMap.end(); )
{
int nKey = iter->first;
string strValue = iter->second;
if (nKey % 2 == 0)
{
map<int, string>::iterator tmpIter = iter;
iter++;
dataMap.erase(tmpIter);
//dataMap.erase(iter++) 这样也行
}else
{
iter++;
}
}
其中,
map<int,
string>::iterator tmpIter = iter; iter++;
dataMap.erase(tmpIter);
这几句的意思是,先保留要删除的节点迭代器,再让iter向下一个有意义的节点,然后删除节点。
所以这个操作结束后iter指向的是下一个有意义的节点,没有失效。
其实这三句话可以用在一句话代替,就是dataMap.erase(iter++);
解释是先让iter指向下一个有效的节点,但是返回给erase函数的是原来的iter副本。这个可能跟++这个操作的本身语法相关。
但是功能跟上面是一样的。