出现乱码需要检查的项目:数据库编码、文件本身的字符集、html解析的字符集,如若上述项目编码一致仍然出现乱码,查看一下浏览器的编码,如果和设置的不一样说明上述设置有部分未成功,可以尝试使用header()函数再转化一下。FYI:1.
header("Content-type: text/html; ...
分类:
Web程序 时间:
2014-05-08 21:28:22
阅读次数:
331
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。
请参考:jsoup.org
例如: 抓取CSDN极客头条内容 soup.bsh
// package org.jsoup.examples;
import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.no...
分类:
编程语言 时间:
2014-05-07 07:29:59
阅读次数:
363