问题
你想使用类似于CSS或jQuery的语法来查找和操作元素。
方法
可以使用Element.select(String
selector) 和 Elements.select(String
selector) 方法实现:
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(inpu...
分类:
Web程序 时间:
2015-03-11 17:25:17
阅读次数:
205
这个示例程序将展示如何从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。
运行下面程序需要指定一个URLs作为参数
package org.jsoup.examples;
import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Docu...
分类:
Web程序 时间:
2015-03-11 17:22:55
阅读次数:
165
问题
在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。
方法
要取得一个属性的值,可以使用Node.attr(String
key) 方法对于一个元素中的文本,可以使用Element.text()方法对于要取得元素或属性中的HTML内容,可以使用Element.html(),
或 Node.outerHtml()方法
示例...
分类:
Web程序 时间:
2015-03-11 17:21:43
阅读次数:
140
问题
在你解析一个Document之后可能想修改其中的某些属性值,然后再保存到磁盘或都输出到前台页面。
方法
可以使用属性设置方法 Element.attr(String
key, String value), 和 Elements.attr(String
key, String value).
假如你需要修改一个元素的 class 属性,可以使用 Element....
分类:
Web程序 时间:
2015-03-11 17:21:31
阅读次数:
115
问题
你有一个包含相对URLs路径的HTML文档,需要将这些相对路径转换成绝对路径的URLs。
方法
在你解析文档时确保有指定base
URI,然后使用 abs: 属性前缀来取得包含base
URI的绝对路径。代码如下:
Document doc = Jsoup.connect("http://www.open-open.com").get();
Element l...
分类:
Web程序 时间:
2015-03-11 17:21:31
阅读次数:
182
问题
你需要修改一个HTML文档中的文本内容
方法
可以使用Element的设置方法::
Element div = doc.select("div").first(); //
div.text("five > four"); // five > four
div.prepend("First ");
div.append(" Last");
// now: First...
分类:
Web程序 时间:
2015-03-11 17:21:16
阅读次数:
136
问题
你需要一个元素中的HTML内容
方法
可以使用Element中的HTML设置方法具体如下:
Element div = doc.select("div").first(); //
div.html("lorem ipsum"); // lorem ipsum
div.prepend("First");//在div前添加html内容
div.append("Last");...
分类:
Web程序 时间:
2015-03-11 17:20:27
阅读次数:
170
问题
在做网站的时候,经常会提供用户评论的功能。有些不怀好意的用户,会搞一些脚本到评论内容中,而这些脚本可能会破坏整个页面的行为,更严重的是获取一些机要信息,此时需要清理该HTML,以避免跨站脚本cross-site scripting攻击(XSS)。
方法
使用jsoup HTML Cleaner 方法进行清除,但需要指定一个可配置的 Whitelist。
String un...
分类:
Web程序 时间:
2015-03-11 17:18:41
阅读次数:
142
毕设需要使用网页上的数据,然后就用到了JSOUP。
Jsoup官网
既然是解析Html,首先要做的就是获取html这个页面,也就是要成功链接url。
就拿我做的举个例子,我需要解析获取我们学校官网上的新闻,链接地址为:http://www.chzu.edu.cn/s/1/t/1152/p/3/list.htm
界面如下:
首先创建一个java项目,引入jsoup包,我用的是jsoup...
分类:
Web程序 时间:
2015-03-11 14:55:13
阅读次数:
163
这是一款通过jsoup解析Html获取内容的网络阅读器,和前面的其实是类似的,也是大学时期闲暇完成,对照CSDN的Web页面元素设计进行解析提取内容,核心功能就是使用jsoup解析。以下是相关截图。...
分类:
移动开发 时间:
2015-03-10 15:32:00
阅读次数:
127