码迷,mamicode.com
首页 > Web开发 > 详细

【Jsoup学习礼记】从一个文件加载一个文档

时间:2015-03-11 17:22:59      阅读:162      评论:0      收藏:0      [点我收藏+]

标签:parse   文件系统   jsoup   

问题

在本机硬盘上有一个HTML文件,需要对它进行解析从中抽取数据或进行修改。

办法

可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

说明

parse(File in, String charsetName, String baseUri) 这个方法用来加载和解析一个HTML文件。如在加载文件的时候发生错误,将抛出IOException,应作适当处理。

baseUri 参数用于解决文件中URLs是相对路径的问题。如果不需要可以传入一个空的字符串。

另外还有一个方法parse(File in, String charsetName) ,它使用文件的路径做为 baseUri。 这个方法适用于如果被解析文件位于网站的本地文件系统,且相关链接也指向该文件系统。

【Jsoup学习礼记】从一个文件加载一个文档

标签:parse   文件系统   jsoup   

原文地址:http://blog.csdn.net/jyg694234697/article/details/44199545

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!