码迷,mamicode.com
首页 > Web开发 > 详细

JSoup-初步使用

时间:2015-08-21 20:55:22      阅读:158      评论:0      收藏:0      [点我收藏+]

标签:

JSoup好处:可以以选择器的方式获取页面信息,简单方便易学习。

这里分别介绍下以get方式和post方式发送http请求获取网页

1、使用get的方式爬信息,以博客园为爬取网页上的标题等信息,爬取200页,通过观察网页可以发现规律,他们有共同的部分“http://www.cnblogs.com/#p”,在使用JSoup的get的方法时,可以通过拼接上页数得到url。具体如下:

技术分享

 2、结合使用Apache的HttpClient的post请求,通过传参获取网页,通过使用Chrome调试发现请求的url是http://www.cnblogs.com/mvc/AggSite/PostList.aspx,也可以查看到传的参数,传递参数时也需要根据页面对参数进行连接。
Chrome调试技术分享
执行代买如下
 
技术分享

JSoup-初步使用

标签:

原文地址:http://www.cnblogs.com/wyhong/p/4748856.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!