问题
在本机硬盘上有一个HTML文件,需要对它进行解析从中抽取数据或进行修改。
办法
可以使用静态 Jsoup.parse(File
in, String charsetName, String baseUri) 方法:
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "...
分类:
Web程序 时间:
2015-03-11 17:22:59
阅读次数:
162
问题
你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构。
方法
将HTML解析成一个Document之后,就可以使用类似于DOM的方法进行操作。示例代码:
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com...
分类:
Web程序 时间:
2015-03-11 17:25:49
阅读次数:
195
问题
你想使用类似于CSS或jQuery的语法来查找和操作元素。
方法
可以使用Element.select(String
selector) 和 Elements.select(String
selector) 方法实现:
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(inpu...
分类:
Web程序 时间:
2015-03-11 17:25:17
阅读次数:
205
问题
在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。
方法
要取得一个属性的值,可以使用Node.attr(String
key) 方法对于一个元素中的文本,可以使用Element.text()方法对于要取得元素或属性中的HTML内容,可以使用Element.html(),
或 Node.outerHtml()方法
示例...
分类:
Web程序 时间:
2015-03-11 17:21:43
阅读次数:
140
问题
你有一个包含相对URLs路径的HTML文档,需要将这些相对路径转换成绝对路径的URLs。
方法
在你解析文档时确保有指定base
URI,然后使用 abs: 属性前缀来取得包含base
URI的绝对路径。代码如下:
Document doc = Jsoup.connect("http://www.open-open.com").get();
Element l...
分类:
Web程序 时间:
2015-03-11 17:21:31
阅读次数:
182
问题
在你解析一个Document之后可能想修改其中的某些属性值,然后再保存到磁盘或都输出到前台页面。
方法
可以使用属性设置方法 Element.attr(String
key, String value), 和 Elements.attr(String
key, String value).
假如你需要修改一个元素的 class 属性,可以使用 Element....
分类:
Web程序 时间:
2015-03-11 17:21:31
阅读次数:
115
这个示例程序将展示如何从一个URL获得一个页面。然后提取页面中的所有链接、图片和其它辅助内容。并检查URLs和文本信息。
运行下面程序需要指定一个URLs作为参数
package org.jsoup.examples;
import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Docu...
分类:
Web程序 时间:
2015-03-11 17:22:55
阅读次数:
165
问题
你需要修改一个HTML文档中的文本内容
方法
可以使用Element的设置方法::
Element div = doc.select("div").first(); //
div.text("five > four"); // five > four
div.prepend("First ");
div.append(" Last");
// now: First...
分类:
Web程序 时间:
2015-03-11 17:21:16
阅读次数:
136
问题
你需要一个元素中的HTML内容
方法
可以使用Element中的HTML设置方法具体如下:
Element div = doc.select("div").first(); //
div.html("lorem ipsum"); // lorem ipsum
div.prepend("First");//在div前添加html内容
div.append("Last");...
分类:
Web程序 时间:
2015-03-11 17:20:27
阅读次数:
170
问题
在做网站的时候,经常会提供用户评论的功能。有些不怀好意的用户,会搞一些脚本到评论内容中,而这些脚本可能会破坏整个页面的行为,更严重的是获取一些机要信息,此时需要清理该HTML,以避免跨站脚本cross-site scripting攻击(XSS)。
方法
使用jsoup HTML Cleaner 方法进行清除,但需要指定一个可配置的 Whitelist。
String un...
分类:
Web程序 时间:
2015-03-11 17:18:41
阅读次数:
142
首先如下在HTML中通过method设置请求方式,而其中的action是设置接受HTML数据的页面。
Get是向服务器发索取数据的请求。
Post是向服务器提交数据的请求。
Get获取信息,它所请求的参数会跟着浏览器地址栏中的URL(解释URL:UniformResource Locator ,在互联网上每个文件都有自己的URL)后进行传递。
例如:htt...
分类:
Web程序 时间:
2015-03-11 17:20:09
阅读次数:
181
Ajax,异步的javascript和XML,一种用于创建快速动态网页的技术。通过Ajax引擎在后台与服务器进行少量数据交换,使网页实现异步更新。先理解同步和异步的概念:同步即在发出一个请求时必须有响应,而异步则是发出请求后可能不能立刻得到结果,也不会影响服务端处理其他活动,而请求完成后返回给发出者。比如下次我请你吃饭一定要及时回复(同步),而你请我的话是不是更愿意是异步呢。
先通过一...
分类:
Web程序 时间:
2015-03-11 17:16:44
阅读次数:
142
本节讲述Arcgis for Js加载ArcgisServer和GeoServer发布的wms服务。...
分类:
Web程序 时间:
2015-03-11 17:15:40
阅读次数:
1725
websocket mosquitto js测试...
分类:
Web程序 时间:
2015-03-11 17:14:08
阅读次数:
8327
thinkphp的CURD中,使用save方法时会出现一个奇怪的问题,即如果数据没有更新(与原数据相同),返回值判断为false。其实很久之前就发现了这个问题,一度以为是官方代码的问题,但是一直拖延到最近才想到要去解决这个问题。不得不说:“明日复明日,明日何其多。事事待明日,万事皆蹉跎。”,与君共勉!
在官网上搜索了这个问题之后,发现官方已经解决了这个问题,原本的判断:
$...
分类:
Web程序 时间:
2015-03-11 17:12:47
阅读次数:
14544
之前在我的博客里面写了一篇文章http://blog.csdn.net/yannanying/article/details/43018175,本文就是为了补充当时的那篇文章而写。我记得当时是参考百度经验里面的一篇文章写的,文章地址为http://jingyan.baidu.com/article/ab0b5630b632dbc15afa7dc4.html,寒假的时候按照这篇文章的相关内容搭建了Ap...
分类:
Web程序 时间:
2015-03-11 17:11:18
阅读次数:
196
原翻译:http://objccn.io/issue-3-2/
可能你很难相信 UIScrollView 和一个标准的 UIView 差异并不大,scroll
view 确实会多出一些方法,但这些方法只是和 UIView 的属性很好的结合到一起了。因此,在要想弄懂 UIScrollView 是怎么工作之前,你需要先了解一下 UIView,特别是视图渲染的两步过程。
光栅化和...
分类:
Web程序 时间:
2015-03-11 17:10:11
阅读次数:
186