``` import requests from bs4 import BeautifulSoup response = requests.get("https://www.autohome.com.cn/news/") # 1. content /text 的区别 # print(response ...
分类:
其他好文 时间:
2019-11-17 22:19:39
阅读次数:
100
import requestsfrom bs4 import BeautifulSouprespone=requests.get('https://www.autohome.com.cn/news/')respone.encoding='gbk'# print(respone.text)soup=B ...
分类:
编程语言 时间:
2019-10-31 18:51:20
阅读次数:
187
#!/usr/bin/env python #-*- coding:utf-8 -*- # requests:用来下载网页源代码的,等同urlopen() #Beautiful Soup,解析html,替代正则部分re #Html #BeautifulSoup().find("a") import ... ...
分类:
其他好文 时间:
2019-07-31 13:19:09
阅读次数:
132
# scrapy框架里下载问价和图片 # 判断文件夹和路径是否存在 # 爬虫文件 import scrapy from bmw.items import BmwItem class Bme5Spider(scrapy.Spider): name = 'bme5' allowed_domains = ... ...
分类:
其他好文 时间:
2019-07-03 00:15:03
阅读次数:
233
[TOC] Python进阶实战之三级菜单 1. 打印省、市、县三级菜单 2. 可返回上一级 3. 可随时退出程序 面条版 北京 上海 山东 第一层 : 背景 北京 上海 山东 第一层 : 北京 海淀 昌平 朝阳 东城 第二层 : 海淀 五道口 中关村 上地 第三层 : 中关村 爱奇艺 汽车之家 y ...
分类:
编程语言 时间:
2019-06-22 19:48:00
阅读次数:
112
#数据结构:menu = { '北京':{ '海淀':{ '五道口':{ 'soho':{}, '网易':{}, 'google':{} }, '中关村':{ '爱奇艺':{}, '汽车之家':{}, 'youku':{}, }, '上地':{ '百度':{}, }, }, '昌平':{ '沙河': ...
分类:
其他好文 时间:
2019-05-19 12:30:06
阅读次数:
116
说说这个网站 汽车之家,反爬神一般的存在,字体反爬的鼻祖网站,这个网站的开发团队,一定擅长前端吧,2019年4月19日开始写这篇博客,不保证这个代码可以存活到月底,希望后来爬虫coder,继续和汽车之间对抗。 CSDN上关于汽车之家的反爬文章千千万万了,但是爬虫就是这点有意思,这一刻写完,下一刻还能 ...
分类:
编程语言 时间:
2019-04-28 15:33:14
阅读次数:
145
12月20日,百度智能小程序开源联盟签约仪式在京举行。爱奇艺、快手、WiFi万能钥匙、58同城、汽车之家、携程、万年历、猎豹移动、百度视频、宝宝巴士、卓易等12家企业与百度正式签约,成为智能小程序开源联盟首批战略合作伙伴。未来上述企业将陆续在各自旗下的App支持运行智能小程序,成为百度智能小程序的重 ...
分类:
微信 时间:
2019-01-14 14:55:28
阅读次数:
235
一、认识requests,beautifulsoup4 ...
分类:
其他好文 时间:
2019-01-14 01:03:56
阅读次数:
284
(1)打印出来的东西乱码,如何处理这个问题? (2) (3) (4) (5)目前的最终版(后期有待完善) 注意注释 (6) ...
分类:
其他好文 时间:
2018-12-23 15:34:24
阅读次数:
161