码迷,mamicode.com
首页 >  
搜索关键字:jsoup    ( 471个结果
apache + httpclient4 + jsoup 进行模拟浏览器url访问
Hi,各位好,好久不玩博客了,最近在新公司无聊的时候,在查看一个其他网站的注册源代码时 发现了一处bug 首先前台页面是这样的结构(不显示相关网站的敏感信息) 这是一个很普通的注册页面,ok,我们看看相关js源代码,找到免费获取验证码的功能 这段代码就是普通的校验手机号,然后发送给短信接口api,60秒的校验重复发送,不知道大家发现问题了吗? 我可以根据url恶意仿造这接口需要的...
分类:Web程序   时间:2016-05-13 15:04:05    阅读次数:311
使用jsoup的爬虫例子
上网了解到网络爬虫,感觉挺使用的,自己写了一个例子。 jsoup的jar包下载地址:http://jsoup.org/download 使用jsoup-1.8.3.jar,这是一个解析html源码的工具,能快速找到某一个节点,非常方便 代码功能是: 2016年msi中rng和skt最后一场比赛刚打完,网页中没有比赛视频的链接,查看网页源码分析出url地址的规律,就尝试找一下。 impor...
分类:Web程序   时间:2016-05-13 00:53:30    阅读次数:224
xsoup
Xsoup 0.2.0 发布,HTML 抽取器 黄亿华 发布于: 2014年03月11日 (4评) 分享到: 分享到: 分享到: 分享到: Xsoup 是一款基于 Jsoup 开发的,使用XPath抽取Html元素的工具。它被用于作者的爬虫框架 WebMagic中,进行XPath 解析和抽取。 此次 ...
分类:其他好文   时间:2016-05-11 13:32:27    阅读次数:2594
Jsoup代码解读之六-防御XSS攻击
Jsoup代码解读之八-防御XSS攻击 Jsoup代码解读之八-防御XSS攻击 防御XSS攻击的一般原理 cleaner是Jsoup的重要功能之一,我们常用它来进行富文本输入中的XSS防御。 我们知道,XSS攻击的一般方式是,通过在页面输入中嵌入一段恶意脚本,对输出时的DOM结构进行修改,从而达到执 ...
分类:Web程序   时间:2016-05-06 21:56:19    阅读次数:333
Jsoup代码解读之五-实现一个CSS Selector
Jsoup代码解读之七-实现一个CSS Selector 当当当!终于来到了Jsoup的特色:CSS Selector部分。selector也是我写的爬虫框架webmagic开发的一个重点。附上一张street fighter的图,希望以后webmagic也能挑战Jsoup! select机制 Js ...
分类:Web程序   时间:2016-05-06 21:49:40    阅读次数:290
Jsoup代码解读之一-概述
Jsoup代码解读之一-概述 今天看到一个用python写的抽取正文的东东,美滋滋的用Java实现了一番,放到了webmagic里,然后发现Jsoup里已经有了…觉得自己各种不靠谱啊!算了,静下心来学学好东西吧! Jsoup是Java世界用作html解析和过滤的不二之选。支持将html解析为DOM树 ...
分类:Web程序   时间:2016-05-06 21:44:03    阅读次数:702
Jsoup代码解读之四-parser
Jsoup代码解读之四-parser Jsoup代码解读之四-parser Jsoup代码解读之四-parser Jsoup代码解读之四-parser 作为Java世界最好的HTML 解析库,Jsoup的parser实现非常具有代表性。这部分也是Jsoup最复杂的部分,需要一些数据结构、状态机乃至编 ...
分类:Web程序   时间:2016-05-06 21:41:23    阅读次数:345
Jsoup代码解读之三-Document的输出
Jsoup代码解读之三-Document的输出 Jsoup代码解读之三-Document的输出 Jsoup官方说明里,一个重要的功能就是output tidy HTML。这里我们看看Jsoup是如何输出HTML的。 HTML相关知识 分析代码前,我们不妨先想想,“tidy HTML"到底包括哪些东西 ...
分类:Web程序   时间:2016-05-06 21:41:09    阅读次数:435
Jsoup代码解读之二-DOM相关对象
Jsoup代码解读之二-DOM相关对象 Jsoup代码解读之二-DOM相关对象 之前在文章中说到,Jsoup使用了一套自己的DOM对象体系,和Java XML API互不兼容。这样做的好处是从XML的API里解脱出来,使得代码精炼了很多。这篇文章会说明Jsoup的DOM结构,DOM的遍历方式。在下一 ...
分类:Web程序   时间:2016-05-06 21:38:10    阅读次数:826
使用Jsoup抓取网站上的图片、链接
以 http://www.zgfjqw.roboo.com/ 中国风景区网为例,我们想要抓取首页的所有图片。 使用Jsoup可以轻松实现。 代码及注释如下: 以 http://www.cnblogs.com/huoxiayu/ 我的博客为例,我们想要抓取该页面的所有链接。 ...
分类:Web程序   时间:2016-05-05 14:21:50    阅读次数:199
471条   上一页 1 ... 23 24 25 26 27 ... 48 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!