标签:jaxp utc static xpage for pid pil htm 使用
需求:
需要采集js渲染的页面,有些网站的页面是js渲染的
实现:
基于HtmlUnit实现:
maven依赖:
说明:
Nutch插件:nutch-htmlunit用于替换Nutch自身的Http Fetch组件
Java使用HtmlUnit抓取js渲染页面
原文地址:http://www.cnblogs.com/love540376/p/6890372.html