码迷,mamicode.com
首页 > Web开发 > 详细

使用Jsoup获取网页内容超时设置

时间:2017-06-03 09:59:35      阅读:671      评论:0      收藏:0      [点我收藏+]

标签:nbsp   time   内容   connect   client   解析   获取   pcl   超时   

使用Jsoup获取网页内容超时设置

最近使用Jsoup来抓取网页,并对网页进行解析,发现很好用。在抓取过程中遇到一个问题,有些页面总是报Timeout异常,开始想是不是被抓取网站对IP进行了限制,后来发现用HttpClient可以获取到内容。

原来我最开始使用Jsoup.connect(url).get();方法获取网页内容,这种方式使用的是默认超时时间3秒。

原来Jsoup是可以设置超时的,修改成如下就可以了:

Jsoup.connect(url).timeout(30000).get(); // 30S

 

使用Jsoup获取网页内容超时设置

标签:nbsp   time   内容   connect   client   解析   获取   pcl   超时   

原文地址:http://www.cnblogs.com/qianzf/p/6936162.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!