标签:jaxp utc static xpage for pid pil htm 使用
需求:
需要采集js渲染的页面,有些网站的页面是js渲染的
实现:
基于HtmlUnit实现:
maven依赖:
说明:
Nutch插件:nutch-htmlunit用于替换Nutch自身的Http Fetch组件
标签:jaxp utc static xpage for pid pil htm 使用
原文地址:http://www.cnblogs.com/love540376/p/6890372.html