前段时间用php的一个插件(phpQuery+queryList)写了采集某个博客的一些博文,然后用linux的自动运行跑,感觉还不错。但在很久之前就已经听说了另外一个插件,可以很好的进行采集,叫做casperJs(http://casperjs.org/),虽然没用过,但见过自己的导师用它来采集一...
分类:
Web程序 时间:
2015-06-30 23:19:27
阅读次数:
155
1.python 环境安装2.PhantomJs安装,戳这里,安装的1.9.8版本的,配置环境变量path:";C:\phantomjs"(注意:安装2.0.0版本,运行casperjs会有提示:PhantomJs is not released)3.casperjsan安装,戳这里,配置环境变量p...
分类:
Web程序 时间:
2015-06-30 18:06:15
阅读次数:
167
1.首先安装python2.安装phantom 1.9.8,戳这里,下载完成后,解压缩,配置环境变量path,";C:\phantomjs"3.安装casperjs,戳这里,下载压缩包,解压缩,配置环境变量path,";C:\casperjs\bin"我安装遇到的问题:之前安装了phantom2.0...
分类:
Web程序 时间:
2015-06-29 20:01:31
阅读次数:
136
使用CasperJs进行自动化测试中文网站的时候发现中文网站截图会出现乱码的现象,中文汉字被一个个小方框代替查找了一些资料发现是因为Linux服务器上没有安装中文字体导致的,Linux如何安装中文字体,百度上有很多。问题在于我没有root权限,百度上的方法都是在root下安装中文字体,在一个同事的帮...
分类:
Web程序 时间:
2015-06-29 14:31:12
阅读次数:
932
Linux(CentOs)下安装Phantomjs + Casperjs是参照cnMiss's Bloghttp://ju.outofmemory.cn/entry/70691的博客进行安装的1、安装Phantomjs下载安装包,由于是https的所以需要有--no-check-certificat...
分类:
Web程序 时间:
2015-06-11 18:30:48
阅读次数:
172
EDIT :Here the best solution : install it via npm :npm install -g slimerjs-g to be available everywhere. And that's it, juste choose your--engine=slim...
因为一些业务需求需要采集淘宝店铺商品的销售价格,但是淘宝详情页面的价格显示是通过js动态调用显示的.所以就没法通过普通的获取页面html然后通过正则或者xpath的方式获取到想到的信息了.所幸我们现在有了casperjs.这个是一个基于Phantomjs的库,而Phantomjs则是一个服务器端的j...
分类:
Web程序 时间:
2015-01-12 13:00:24
阅读次数:
398
1、casperjshttp://casperjs.org/CasperJSis a navigation scripting & testing utility forPhantomJSandSlimerJSwritten in Javascript2、phantomjs http://phant...
分类:
Web程序 时间:
2015-01-02 18:43:37
阅读次数:
205
如果是类似12306这种垃圾网站的话, 必须使用--ssl-protocol=any --ignore-ssl-errors=true选项, 例如 casperjs --ssl-protocol=any --ignore-ssl-errors=true crawler.js可以尝试这两个方法:1)....
分类:
编程语言 时间:
2014-12-18 16:31:28
阅读次数:
1878
windows环境。capserjs的中文乱码使用phantom.outputEncoding="GBK";即可解决。但当我们脚本很大,需要拆分时(参考http://docs.casperjs.org/en/latest/writing_modules.html),拆分到另一文件(example.j...
分类:
Web程序 时间:
2014-11-29 22:56:05
阅读次数:
631