码迷,mamicode.com
首页 > 其他好文 > 详细

正则获取页面编码 判断当前页面的编码

时间:2014-08-17 18:23:02      阅读:188      评论:0      收藏:0      [点我收藏+]

标签:style   blog   color   io   数据   ar   div   line   

 

        //根据指定网址判断当前页面的编码
        static public string GetWebpageCode(string url)
        {
            string charSet = "";

            WebClient myWebClient = new WebClient();    

            myWebClient.Credentials = CredentialCache.DefaultCredentials;

            //从资源下载数据并返回字节数组。(加@是因为网址中间有"/"符号) 
            byte[] myDataBuffer = myWebClient.DownloadData(url);
            string strWebData = Encoding.Default.GetString(myDataBuffer);

            //获取网页字符编码描述信息 
            Match charSetMatch = Regex.Match(strWebData, "<meta([^<]*)charset=([^<]*)\"", RegexOptions.IgnoreCase | RegexOptions.Multiline);
            string webCharSet = charSetMatch.Groups[2].Value;
            if (charSet == null || charSet == "")
                charSet = webCharSet;
            
            return charSet;

        }

 

正则获取页面编码 判断当前页面的编码,布布扣,bubuko.com

正则获取页面编码 判断当前页面的编码

标签:style   blog   color   io   数据   ar   div   line   

原文地址:http://www.cnblogs.com/chenghu/p/3918036.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!