码迷,mamicode.com
首页 > Web开发 > 详细

快速抓取某个网站内容方法

时间:2014-05-04 00:16:12      阅读:368      评论:0      收藏:0      [点我收藏+]

标签:class   c#   

是不是有人相抓取网页上面的内容,放到别的网站上面。下面我给大家介绍一种最常用的方法:

HtmlAgilityPack 组件。

 public String GetHtml()
        {
            string url = "http://t.news.fx168.com/";
            HttpWebRequest request = HttpWebRequest.Create(url) as HttpWebRequest;
            using (HttpWebResponse response = request.GetResponse() as HttpWebResponse)
            {
                using (Stream stream = response.GetResponseStream())
                {
                    HtmlDocument doc = new HtmlDocument();
                    doc.Load(stream, System.Text.Encoding.UTF8);

                    HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class=‘hzh_FX168_news_main_left_listbg3‘]");
                    return node.InnerHtml;
                }
            }
        }

大家可以运行下试试,抓取了火线速递的内容页面新闻列表。抓取规则是抓取DIV的CLASS为hzh_FX168_news_main_left_listbg3内的内容。



快速抓取某个网站内容方法,布布扣,bubuko.com

快速抓取某个网站内容方法

标签:class   c#   

原文地址:http://blog.csdn.net/yancongmin0702/article/details/24891757

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!