码迷,mamicode.com
首页 > 编程语言 > 详细

java 去html标签,去除字符串中的空格,回车,换行符,制表符

时间:2014-08-11 11:38:32      阅读:287      评论:0      收藏:0      [点我收藏+]

标签:java   os   div   html   line   amp   htm   字符串   

  public static String getonerow(String allLine,String myfind)
    {
           
              Pattern pattern = Pattern.compile("<div class=\"row\">.*?</div>");        
             Matcher  matcher = pattern.matcher(allLine);
            while(matcher.find()) {
                String  myval = matcher.group();
                int npos=myval.indexOf(myfind);
                if(npos>=0)
                {
                    npos = myval.indexOf("<span class=\"cell value\">");
                    if(npos>0)
                    {
                         String content = myval.substring(npos,myval.length());
                         content=content.replaceAll("</?[^>]+>","");   //剔出了<html>的标签
                         content=content.replace("&nbsp;","");
                         content=content.replace(".","");
                         content=content.replace("\"","‘");
                         content=content.replace("‘","‘");
                         content=content.replaceAll("\\s*|\t|\r|\n","");//去除字符串中的空格,回车,换行符,制表符
                         return content;
                    }
                }
            }
            return "";
   
    }

java 去html标签,去除字符串中的空格,回车,换行符,制表符,布布扣,bubuko.com

java 去html标签,去除字符串中的空格,回车,换行符,制表符

标签:java   os   div   html   line   amp   htm   字符串   

原文地址:http://www.cnblogs.com/zheh/p/3904180.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!