码迷,mamicode.com
首页 > Web开发 > 详细

Jsoup源码分析(一)

时间:2014-07-03 09:39:57      阅读:239      评论:0      收藏:0      [点我收藏+]

标签:des   blog   http   java   使用   数据   

概述

Jsoup是一款Java 的HTML解析器。支持将html解析为DOM树、支持CSS Selector形式选择、支持html过滤,本身还附带了一个Http下载器。jsoup代码简洁,总共53个类,代码大约9000行,无第三方依赖,代码结构如下所示

jsoup
├── examples #样例,包括一个将html转为纯文本和一个抽取所有链接地址的例子。 
├── helper #一些工具类,包括读取数据、处理连接以及字符串转换的工具
├── nodes #DOM节点定义
├── parser #解析html并转换为DOM树
├── safety #安全相关,包括白名单及html过滤
└── select #选择器,支持CSS Selector以及NodeVisitor格式的遍历

使用

Jsoup的入口是Jsoup类。首先将html解析成DOM树,分别用CSS Selector以及NodeVisitor来操作Dom元素,示例代码如下

 

 

参考:http://my.oschina.net/flashsword/blog/156748

        http://jsoup.org/

Jsoup源码分析(一),布布扣,bubuko.com

Jsoup源码分析(一)

标签:des   blog   http   java   使用   数据   

原文地址:http://www.cnblogs.com/flyingsnail/p/3818373.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!