码迷,mamicode.com
首页 > 其他好文 > 详细

matlab学习 — 实现简单的爬虫

时间:2018-03-15 13:14:06      阅读:174      评论:0      收藏:0      [点我收藏+]

标签:ken   imwrite   regex   har   php   bubuko   网址   pos   div   

  这里复杂的情况暂时不考虑。。测试网址为pixiv的每日排行榜 = =

url = ‘https://www.pixiv.net/ranking.php?mode=daily‘
text = webread(url) % urlopen函数也可以打开网页
link = regexp(text,‘data-filter=".*?lazy-image"data-src="(https.+?.(jpg|png))"‘,‘tokens‘) % 区分大小写的正则表达式函数 tokens匹配所有圆括号中的标文 regexpi函数不区分大小写

for i = 1 : length(link)
rgb = webread(char(link{i})) % webread函数可读取图片、音频等数据并返回对应的解析数据
imshow(rgb) % 显示图片
type = char(link{i})
name = [num2str(i) type(end-4:end)]
imwrite(rgb,[‘C:\Users\adimin\Desktop\video\‘ name]) % 下载
end

  

  运行结果:

技术分享图片

  emm。。。实际上,才跑了一张图就停了233,不知道是不是太快了 还是什么,停掉的原因是被请求被禁止了:403
  不过有效果就算成功了。

matlab学习 — 实现简单的爬虫

标签:ken   imwrite   regex   har   php   bubuko   网址   pos   div   

原文地址:https://www.cnblogs.com/darkchii/p/8572760.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!