刚刚学习了XPath路径表达式,主要是对XML文档中的节点进行搜索,通过XPath表达式可以对XML文档中的节点位置进行快速定位和访问,html也是也是一种类似于xml的标记语言,但是语法没有那么严谨,在codeplex里有一个开源项目HtmlAgilityPack,提供了用XPath解析HTML文...
分类:
Web程序 时间:
2014-10-24 14:15:51
阅读次数:
293
HtmlAgilityPack中的HtmlNode类与XmlNode类差不多,提供的功能也大同小异。下面来看看该类提供功能。一、静态属性public static Dictionary //ElementsFlags;获取集合的定义为特定的元素节点的特定行为的标志。表包含小写标记名称作为键和作为值的...
分类:
Web程序 时间:
2014-10-22 10:49:48
阅读次数:
174
本例中主要是通过HtmlAgilityPack解析html源码获取所需的数据. using HtmlAgilityPack;1.通过C#中WebRequest,WebResponse,StreamReader类获取网页源代码WebRequest request = WebRequest.Create...
分类:
Web程序 时间:
2014-10-17 18:15:13
阅读次数:
186
本例中主要是通过HtmlAgilityPack解析html源码获取所需的数据. using HtmlAgilityPack;1.通过C#中WebRequest,WebResponse,StreamReader类获取网页源代码WebRequest request = WebRequest.Create...
分类:
Web程序 时间:
2014-10-17 16:50:24
阅读次数:
135
以前WP7下是用的HtmlAgilityPack和XPath来解析网页,很好用。但是在Wp8.1下,这个里面却缺少了一个很重要的方法。1 HtmlDocument doc = new HtmlDocument(); //实例化HtmlDocument对象2 doc.LoadHtml(html);.....
分类:
Web程序 时间:
2014-10-09 00:25:28
阅读次数:
203
HtmlAgilityPack是一个基于.Net的、第三方免费开源的微型类库,主要用于在服务器端解析html文档(在B/S结构的程序中客户端可以用Javascript解析html)。截止到本文发表时,HtmlAgilityPack的最新版本为1.4.0。下载地址:http://htmlagility...
分类:
Web程序 时间:
2014-09-23 19:36:05
阅读次数:
227
htmlagilitypack是解析html种的元素,常用的一点就是解析title或者head,但是nuget下载不下来(到笔者写此文章为止),后来经朋友指点发现,导入HtmlAgilityPack解析路径的时候,不止需要这个dll,还需要微软自己的一个dll,名为:System.Xml.XPath...
分类:
Web程序 时间:
2014-09-09 12:20:48
阅读次数:
221
一般解决方式:http://www.cnblogs.com/kissdodog/archive/2013/02/28/2936950.html特殊处理方式:如果请求页面ContentEncoding=gzip//获取ContentEncodingstatic void getch(string ur...
分类:
Web程序 时间:
2014-09-08 02:09:36
阅读次数:
301
第一种方式: publicstaticHtmlDocumentLoadHtmlByUrls(stringurl){HtmlDocumenthtmldoc;HtmlWebhtmlWeb=newHtmlWeb(); //不够完善 此内置方法导致中文乱码//htmlWeb.Overrid...
分类:
Web程序 时间:
2014-08-06 18:25:51
阅读次数:
468
接经验总结20的WEB请求。
如果获取的数据是HTML的话,我们就需要第三方工具有辅助获取我们需要的数据。
我选用了HtmlAgilityPack这么个工具。
首先肯定去网上下载一个,然后引用到项目中。下载地址:http://htmlagilitypack.codeplex.com/
1、模拟WEB请求。获取到HTML数据。详细请看之前的文章。
string result="";
2、...
分类:
Web程序 时间:
2014-07-28 16:04:43
阅读次数:
307