[^目录]:回到目录 [目录]^目录 [Toc] 1、常见浏览器所用的内核 IE:trident内核 Firefox:gecko内核 Safari:webkit内核 Opera:最初是自己的 Presto 内核,后来加入谷歌大军,从 Webkit 又到了 Blink 内核 Chrome:统称为 Ch ...
分类:
Web程序 时间:
2020-03-21 21:02:44
阅读次数:
89
1. 查找网址http://fj.huatu.com/zt/2019zwb/diqu/9.html 2.找到源代码 3.爬取所需内容 4.编写程序 import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl="http://f ...
分类:
其他好文 时间:
2020-03-21 10:04:34
阅读次数:
58
import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl = 'http://top.baidu.com/buzz?b=62'headers = {'User-Agent: Mozilla/5.0 (Windows NT 1 ...
分类:
其他好文 时间:
2020-03-20 19:57:30
阅读次数:
75
主要使用request库和beautifulSoup库爬取今日热榜的数据。 具体代码实现: 1 import requests 2 from bs4 import BeautifulSoup 3 import time 4 import pandas 5 import re 6 7 def get_ ...
分类:
编程语言 时间:
2020-03-19 13:50:59
阅读次数:
94
1 import requests 2 kw = {'wd':"中国"} 3 headers = { 4 "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/ ...
分类:
其他好文 时间:
2020-03-16 21:38:01
阅读次数:
81
因为要学习数据分析,需要从网上爬取数据,所以开始学习爬虫,使用python进行爬虫,有好几种模拟发送请求的方法,最基础的是使用urllib.request模块(python自带,无需再下载),第二是requests模块(第三方库,需要pip install requests),第三是直接使用scap ...
分类:
其他好文 时间:
2020-03-14 21:42:20
阅读次数:
80
#使用pip或者pip3安装requests库pip3 install requests #requests库:python #输入python进入命令行模式在cmd命令行中依次运行以下代码,或者直接在PyCharm中直接运行: import requests # 导入requests库 # 添加请 ...
分类:
编程语言 时间:
2020-03-07 20:33:39
阅读次数:
73
我在“python3开发桌面软件之程序主体”一文中已经分享了919网监助手1.0程序的主体源代码(即events.py中的代码),后用迭代器、生成器表达式等对代码进行优化,使程序运行更快、更稳定。优化后的代码如下: #coding:utf-8import wximport configparseri ...
分类:
其他好文 时间:
2020-03-02 14:57:01
阅读次数:
58
浏览器五大内核 1、Trident(IE内核) IE、遨游、腾讯、世界之窗、360 代表作品:IE(此内核只适用于windows) 2、Gecko(火狐内核) 代表作品:firefox(开源且跨平台) 3、Webkit 代表作品:chrome(谷歌-前期)、safari(苹果)开源 4、Presto ...
分类:
其他好文 时间:
2020-02-29 22:36:18
阅读次数:
107
import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0', 'cookie': '' } url = "http ...
分类:
其他好文 时间:
2020-02-26 11:33:08
阅读次数:
150