业务时间做了个小网站,超级冷笑话,地址:http://www.superjokes.cn/开发技术:asp.net mvc5 +SQLServer2012ORM:NPoco用了简单的三层结构使用HtmlAgilityPack做了个小爬虫,目前可以爬取部分网站的笑话,哈哈,有点不地道。代码写的很简单,...
分类:
Web程序 时间:
2015-06-09 19:15:17
阅读次数:
139
///
/// 获取相应的标签内容
///
/// 地址链接
/// css路径
///
public static IEnumerable GetUrlInfo(string url, string cssLoad)
{
HtmlAgilityPack.H...
分类:
其他好文 时间:
2015-04-23 15:42:13
阅读次数:
337
【转】HtmlAgilityPack 之 HtmlNode类HtmlAgilityPack中的HtmlNode类与XmlNode类差不多,提供的功能也大同小异。下面来看看该类提供功能。一、静态属性public static Dictionary //ElementsFlags;获取集合的定义为特定的...
分类:
Web程序 时间:
2015-04-01 16:49:20
阅读次数:
134
这两天在做个爬虫, 一次任务要下载3万多个页面, 然后从这3万多个页面提取数据.以前写过两年的类似的东西, 基本都是写正则表达式, 速度快, 就是写正则表达式老费劲了, 目标网页稍微改动一点就要重写正则.后来我用了 HtmlAgilityPack + Fizzler, 很轻松的就处理了.昨天, 我找...
分类:
其他好文 时间:
2015-01-29 17:13:50
阅读次数:
405
前段时间公司在山铝地磅机房拷贝数据,把数据录入到自己的系统中,想将地磅的数据自动导入,我去看了下,发现导出文件格式是html,好事多磨的找到了HtmlAgilityPack这个神器。代码比较乱,思路也没理清,不过最终效果不错。2015-01-25这是需要导入的文件,需要的都是表格内部单元格的数据,下...
分类:
Web程序 时间:
2015-01-25 13:45:43
阅读次数:
139
也是闲着,看到我伦的qq音乐的收听量居然才520万,伤心。就抓下其他歌手的收听量,做个对比。
用到HtmlAgilityPack,Newtonsoft.Json
1. [代码][C#]代码
//设置listview的相关属性
listView1.GridLines
= true;
listView1.View
= View.Details;
...
最近经常需要下载一些东西,而这个下载地址又会经过层层跳转,每个页面上都有很多广告,烦不胜烦,所以做了一个一键获得最终下载地址的小工具。使用C#,来获取网页内容,然后通过HtmlAgilityPack获取某a标签的href,不断循环,层层跳转,最后获得最终下载地址。 下面,介绍HtmlAgil...
HtmlAgilityPack中的HtmlNode类与XmlNode类差不多,提供的功能也大同小异。下面来看看该类提供功能。一、静态属性public static Dictionary //ElementsFlags;获取集合的定义为特定的元素节点的特定行为的标志。表包含小写标记名称作为键和作为值的...
HtmlAgilityPack是.net下的一个HTML解析类库。支持用XPath来解析HTML。这个意义不小,为什么呢?因为对于页面上的元素的xpath某些强大的浏览器能够直接获取得到,并不需要手动写。节约了大半写正则表达式的时间,当然正则表达式有时候在进一步获取的时候还需要写,但是通过xpath...
http://htmlagilitypack.codeplex.com/wikipage?title=Examples http://nuget.org/packages/HtmlAgilityPack HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPac...
分类:
Web程序 时间:
2014-10-27 17:00:57
阅读次数:
169