标签:pre -- 网站 搭建 lin close tar 观察 span
原文引用https://www.dazhuanlan.com/2019/08/25/5d6235bb190fd/
用koa2.x写下载漫画的爬虫:
使用koa2.x的async ,await解决异步问题,写一个下载漫画的爬虫,代码里有惊喜和福利哦!
koa2 spider
,生成项目图片或者漫画爬虫的思路很简单,首先观察url的规律,把url按规律加入到下载任务,其实就是请求获得html内容,然后对html进行解析,找到下载的图片url(一般都是img标签的src属性值),把url放到数组保存,使用async await控制所有的任务,直到把所有的图片下载完。
但是nodejs本身上异步的,如果你直接在for循环里去下载,肯定是不行的,必须控制好异步的执行上关键。
爬虫简单,处理好异步难。这里我使用的es7中async,await配合promise解决异步问题,还可以使用async模块,eventproxy,等等异步控制模块来解决。
|
|
由于爬虫的复杂性基于不同的网站,不同的任务很不一样,这里只是把几个常用的变量抽取到了config.js。
其实无论是写爬虫还是些其他进程,使用nodejs很大一部分都是要处理异步,要学好nodejs必须学好异步处理。
标签:pre -- 网站 搭建 lin close tar 观察 span
原文地址:https://www.cnblogs.com/petewell/p/11408081.html