标签:str 形式 urllib 内容 imp html www compile 设置
#四个步骤
1.查看crawl内容的源码格式 crawl的内容可以是 url(链接),文字,图片,视频
2.请求网页源码 (可能要设置)代理,限速,cookie
3.匹配 用正则表达式匹配
4.保存数据 文件操作
#两个基本工具(库)
1.urllib
2.requests
#使用reuests库的一个例子,抓取可爱图片
标签:str 形式 urllib 内容 imp html www compile 设置
原文地址:https://www.cnblogs.com/vvlj/p/9580423.html