之前写的两篇爬虫体验基本上涵盖了一般的Html页面提取场景,但是有些时候,如果目标页面不是纯静态的页面,而是使用js动态渲染的页面(比如one),之前的爬虫就不好使了,这种时候就要借助一些其他工具来进行实现。一般爬取动态页面的思路是通过软件模拟浏览器行为获取到渲染后的页面镜像,然后再对渲染后的页面进... ...
分类:
Web程序 时间:
2019-10-09 15:56:02
阅读次数:
320
前言:最近因为项目宣传,所以用Puppeteer写了一个批量上传抖音视频的自动化程序用于推广。 环境和依赖:node,puppeteer 废话不多说,直接上代码: 演示:首次登陆需要扫二维码,之后就可以在一旁喝茶了。 ...
分类:
Web程序 时间:
2019-10-01 10:09:17
阅读次数:
182
Puppeteer自适应分辨率,可以将defaultViewport设为null, 启动的时候还是半屏显示,点击最大化按钮,可以最大化显示。 这样分辨率能够自适应操作系统。 具体可看:https://github.com/GoogleChrome/puppeteer/issues/3688#issu ...
分类:
其他好文 时间:
2019-09-27 10:31:49
阅读次数:
387
原文地址: "Puppeteer在win2008 R2下的坑" 不要使用默认的 Windows 命令处理程序(CMD.exe) 使用PowerShell或第三方命令行工具来执行Puppeteer,例如Git自带的git bash。 在cmd下执行各种报错,启动Chromium页面直接崩溃。。。 在w ...
一、概要 前面介绍了Puppeteer+jest+TypeScript做UI自动化,但是这知识基础的,我们实现自动化要考虑的很多,比如PO模式,比如配置文件,比如断言等等。下面就来一一实现我是怎么用puppeteer 做UI自动化的 二、断言 (一)需要依赖的安装包 依赖包 | 命令 | Jest ...
分类:
其他好文 时间:
2019-08-23 18:59:45
阅读次数:
157
前提:掌握Jest + Puppeteer "1.Jest环境配置" "2.Jest MATCHERS匹配器" "3.Jest 全局变量设置" "4.Puppeteer安装" "5.Puppeteer元素获取" "6.Puppeteer文本值获取" "7.Puppeteer iframe切换" "8 ...
分类:
其他好文 时间:
2019-08-20 18:55:23
阅读次数:
168
puppeteer运行时报错: 解决: 在 await browser.close(); 前添加上等待时间 await page.waitFor(1000); ps:虽然问题解决了,但是还是不太明白原因。 因为其它的文件在关闭浏览器前没加等待时间并不会报错。 前添加上等待时间 ps:虽然问题解决了, ...
分类:
其他好文 时间:
2019-08-14 16:46:08
阅读次数:
311
一、知识点 ignoreDefaultArgs:['--enable-automation'] waitUntil 二、解析知识点 1.page.mouse 以下,截图来自github puppeteer api(自行对照github) ,puppeteer已经提供给我们使用方法,很简单,move ...
分类:
其他好文 时间:
2019-08-09 19:33:31
阅读次数:
173
render方法 我们先理一下关系 和的作者是同一个人, 是`nodejs puppeteer`的非官方实现 调用的 与浏览器进行交互, 的中文文档 "点这里传送" 的文档 "博文参考" 调用render 方法启动 使用之前要先下载 "下载地址" 你懂的,天朝网络环境很复杂,如果要用 自己绑定的 , ...
分类:
Web程序 时间:
2019-08-07 22:21:40
阅读次数:
181
一、涉及的知识点 二、学习网址 https://github.com/GoogleChrome/puppeteer/blob/v1.19.0/docs/api.md 三、环境 node js puppeteer 编辑器 vscode 四、实例 -- 常用元素选择器 1. id 选择器 实例网址:ht ...
分类:
其他好文 时间:
2019-08-06 18:19:51
阅读次数:
2542