1.新建一个web页。
2.添加引用,引入htmlagilitypack。
3.代码
protected void Page_Load(object sender, EventArgs e) { HtmlWeb htmlWeb = new HtmlWeb(); //实例化HtmlAgilityPack.HtmlDocument对象,并载入html页 HtmlDocument htmlDoc = htmlWeb.Load(@"你的url"); //根据XPATH来索引节点 HtmlNodeCollection anchors = htmlDoc.DocumentNode.SelectNodes("你需要的html内容的xpath"); foreach (HtmlNode anchor in anchors) Response.Write(anchor.InnerHtml + "<br/>"); Response.End(); }
HtmlWeb类是一个从网络上获取一个HTML文档的类,其提供的功能大多是基于完成此需求出发。
HtmlDocument类对应着一个HTML文档代码。它提供了创建文档,装载文档,修改文档等等一系列功能。