环境:Centos 6.5介绍:PhantomJS 是一个基于 WebKit 的服务器端 JavaScript API。它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。 PhantomJS 可以用于 页面自...
分类:
Web程序 时间:
2015-12-31 20:54:39
阅读次数:
206
//要读取的文件路径,支持TXT和CSVvar openFilepath="lieBiao.txt";phantom.outputEncoding="GB2312";//输出编码var idList=new Array();//读取文件信息的方法function ReadIdList(){ c...
分类:
编程语言 时间:
2015-12-31 12:18:49
阅读次数:
161
CasperJs是一个基于PhantomJs的工具,其比起PhantomJs能够更加方便的进行navigation。一个最简单的CasperJs代码创建一个文件baidu.js。用来模拟我们訪问百度页面var casper = require('casper').create();casper.st...
分类:
Web程序 时间:
2015-12-29 22:31:33
阅读次数:
205
最近在使用Python爬取网页内容时,总是遇到JS临时加载、动态获取网页信息的困难。例如爬取CSDN下载资源评论、搜狐图片中的“原图”等,此时尝试学习Phantomjs和CasperJS来解决这个问题。这第一篇文章当然就是安装过程及入门介绍,主要先介绍Phantomjs安装过程及常见用法,参考官方文...
分类:
编程语言 时间:
2015-12-18 06:56:32
阅读次数:
378
前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(InfoBox),这也是毕业设计实体对齐和属性的对齐的语料库前期准备工作。希望文章对你有所帮助~
分类:
编程语言 时间:
2015-12-18 06:50:03
阅读次数:
486
由于自己不怎么会javascripts,无法找全所有的参数进行模拟提交,所以只能寻求Selenium和PhantpmJS的方式。先说下ubuntu上怎么安装相应的环境,尤其PhantomJS安装比较蛋疼。其他内容后续再补1.环境配置pip install selenium安装PhantomJS采取曲...
分类:
Web程序 时间:
2015-12-14 22:58:52
阅读次数:
259
用phantomjs去截取中文页面的网站可能会出现乱码的情况,也就是截图中中文的位置全是方框。解决办法就是安装字体。在centos中执行:yum install bitmap-fonts bitmap-fonts-cjk在ubuntu中执行:sudo apt-get install xfonts-w...
分类:
Web程序 时间:
2015-12-12 12:31:32
阅读次数:
485
简单分享一下,后台使用nodejs结合highcharts、phantomjs生成报表图片的方法。这主要应用在日报邮件。主要参考以下资料:http://www.highcharts.com/component/content/article/2-news/52-serverside-generate...
分类:
Web程序 时间:
2015-11-12 19:33:01
阅读次数:
283
本文简要介绍了PhantomJS的相关基础知识点,主要包括PhantomJS的介绍、下载与安装、HelloWorld程序、核心模块介绍等。由于鄙人才疏学浅,难免有疏漏之处,欢迎指正交流。 1、PhantomJS是什么? PhantomJS是一个基于webkit的JavaScript API。它使.....
分类:
Web程序 时间:
2015-11-04 17:27:41
阅读次数:
372
几篇不错的关于蜘蛛程序的教程,转录一下: pyspider 爬虫教程(一):HTML 和 CSS 选择器 pyspider 爬虫教程(二):AJAX 和 HTTP pyspider 爬虫教程(三):使用 PhantomJS 渲染带 JS 的页面
分类:
其他好文 时间:
2015-09-20 10:27:21
阅读次数:
137