码迷,mamicode.com
首页 > 编程语言 > 详细

[C/C++11]_[初级]_[使用正则表达式库regex]

时间:2016-03-21 15:23:56      阅读:271      评论:0      收藏:0      [点我收藏+]

标签:

场景

  1. 正则表达式在处理非常量字符串查找,替换时能很省事,如果稍微复杂点的字符串匹配, 没有正则表达式还真做不出来.
  2. C++11 为我们提供了正则表达式库. 使用起来比boost的正则库方便.
  3. 搞Java 的一定觉得很搞笑,这都是Java的标配功能, 怎么C++11才支持这个库,vs2010 以才支持.建议在处理字符串搜索替换时,直接用正则吧,代码量少,快速.

参考

std::regex_replace
std::regex_iterator
Regular Expressions (C++)

说明

  1. 正则表达式的语法我不多说了,vs2010 如果模式字符串写错,运行也会崩溃.一般调用正则方法时报错基本就是模式字符串写错了.
  2. 正则的语法真的很多,向前向后,分组…看参考吧,一般不需要全部学会就够用了.

例子


// test_reg.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include <regex>
#include <string>
#include <assert.h>
#include <iostream>

static std::string kHtmlSnippet = "<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main.png\" width=\"30%\" height=\"30%\"></p>"
"<ol>"
"<li>ddd中文歌</li>"
"<li>xxx</li>"
"</ol>"
"<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main-about.png\" width=\"30%\" height=\"30%\"></p>"
"<ol>"
"<li>xxxxx</li>"
"</ol>"
"<p><img src=\"D:\\DOC\\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\\&#x9700;&#x6C42;&#x6587;&#x6863;\\&#x5B89;&#x5353;&#x52A9;&#x624B;\\android\\images\\main\\main-setting.png\" width=\"30%\" height=\"30%\"></p>";

void TestReplace()
{
    std::cout << "TestReplace ====" << std::endl;

    // 把所有 img src 的绝对路径替换为 images 开始的相对路径.
    // 使用分组即可.
    std::regex img_regex("(<img [^>]*src=[\"‘]{1})([^\"‘]*)\\\\(images\\\\[^\"‘]*[\"‘]{1}[^>]*>)");
    std::smatch color_match;

    std::string rep = "$1$3";
    std::string tmp = std::regex_replace(kHtmlSnippet,img_regex,rep);
    std::cout << tmp << std::endl;

}

void TestSearch()
{
    std::cout << "TestSearch ====" << std::endl;

    // 查找所有的img完整标签
    std::regex img_regex("<img [^>]+>");

    // 使用 std::regex_search 查询第一个匹配的字符串.
    std::smatch color_match;
    std::cout << "regex_search ====" << std::endl;
    if(std::regex_search(kHtmlSnippet, color_match, img_regex))
    {
        std::cout << color_match[0] << ‘\n‘;
    }

    // 使用类 std::regex_iterator 来进行多次搜索.
    std::cout << "sregex_iterator ====" << std::endl;
    auto words_begin =
        std::sregex_iterator(kHtmlSnippet.begin(), kHtmlSnippet.end(), img_regex);
    auto words_end = std::sregex_iterator();
    for (std::sregex_iterator i = words_begin; i != words_end; ++i)
    {
        std::smatch match = *i;                                                 
        std::string match_str = match.str();
        std::cout << match_str << ‘\n‘;
    }
}

int _tmain(int argc, _TCHAR* argv[])
{
    TestSearch();
    TestReplace();
    return 0;
}

输出:

TestSearch ====
regex_search ====
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main.png" width="30%" he
ight="30%">
sregex_iterator ====
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main.png" width="30%" he
ight="30%">
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main-about.png" width="3
0%" height="30%">
<img src="D:\DOC\&#x4E2A;&#x4EBA;&#x8F6F;&#x4EF6;\&#x9700;&#x6C42;&#x6587;&#x686
3;\&#x5B89;&#x5353;&#x52A9;&#x624B;\android\images\main\main-setting.png" width=
"30%" height="30%">
TestReplace ====
<p><img src="images\main\main.png" width="30%" height="30%"></p><ol><li>ddd中文
歌</li><li>xxx</li></ol><p><img src="images\main\main-about.png" width="30%" hei
ght="30%"></p><ol><li>xxxxx</li></ol><p><img src="images\main\main-setting.png"
width="30%" height="30%"></p>

[C/C++11]_[初级]_[使用正则表达式库regex]

标签:

原文地址:http://blog.csdn.net/infoworld/article/details/50946545

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!