标签:
前言:此本版是中文教程,在英文的教程的基础上翻译过来的
中文版下载:http://pan.baidu.com/s/1i3knK81
英文原版参考:http://jsoup.org/cookbook/
一、入门
解析和遍历一个html文档
二、输入
解析一个html字符串
解析一个body片断
根据一个url加载Document对象
根据一个文件加载Document对象
三、数据抽取
使用dom方法来遍历一个Document对象
使用选择器语法来查找元素
从元素集合抽取属性、文本和html内容
URL处理
程序示例:获取所有链接
四、数据修改
设置属性值
设置元素的html内容
设置元素的文本内容
五、html清理
消除不受信任的html (来防止xss攻击)
jsoup中文教程
原文地址:http://my.oschina.net/liuhaihua/blog/496600