码迷,mamicode.com
首页 > Web开发 > 详细

正则表达式清除Html

时间:2014-09-02 22:46:55      阅读:259      评论:0      收藏:0      [点我收藏+]

标签:style   blog   http   color   io   ar   div   sp   log   

正则表达式,去除所有HTML标签

protected void Page_Load(object sender, EventArgs e)
    {
        //string regexstr = @"<[^>]*>";    //去除所有的标签
        //@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除
         
        // string regexstr = @"<img[^>]*>";   //去除图片的正则
       // string regexstr = @"<(?!br).*?>";   //去除所有标签,只剩br
        // string regexstr = @"<table[^>]*?>.*?</table>";   //去除table里面的所有内容
        string regexstr = @"<(?!img|br|p|/p).*?>";   //去除所有标签,只剩img,br,p
   
        str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
    }

正则表达式获取HTML中的Img

(src\s?=\s?["|‘‘|\s]?)(\S+/)(\S+\.[^"^‘‘^ ]+)

正则表达式中.代表换行以外任意字符,正则表达式匹配任意字符(包括换行)

([\s\S]*) 

 一直在用的正则表达式工具 Regex Match tracer

 

  

正则表达式清除Html

标签:style   blog   http   color   io   ar   div   sp   log   

原文地址:http://www.cnblogs.com/afeng7882999/p/3952380.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!