import re import requests import random import time import os.path from bs4 import BeautifulSoup import pymysql user_agent_list = [ "Mozilla/5.0 (Wind ...
分类:
其他好文 时间:
2020-07-09 15:06:17
阅读次数:
72
http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html 代码: import requests from bs4 import BeautifulSoup import bs4 def getHTMLtext(url):#获取 ...
分类:
其他好文 时间:
2020-07-09 10:43:51
阅读次数:
61
爬取素材库。直接存入mysql数据库。 包含html源码直接存入数据库需要的转义函数。 替换掉源码中的html注释语句 import re import requests import random import time from bs4 import BeautifulSoup import p ...
分类:
数据库 时间:
2020-07-08 23:04:25
阅读次数:
80
import requests from bs4 import BeautifulSoup # 实现有道在线翻译 trans_url = 'http://m.youdao.com/translate' headers = {'User-Agent': 'Mozilla/5.0 (Linux; And ...
分类:
其他好文 时间:
2020-07-08 22:57:00
阅读次数:
222
又被老师要求去搞Python ,曰,,下午回顾了一下Python的基础知识,写了个爬取图片的程序,在此做个分享吧。不喜勿喷 import requests import time from bs4 import BeautifulSoup import uuid # 下载单个页面的一些图片 def ...
分类:
编程语言 时间:
2020-07-08 20:02:59
阅读次数:
82
# -*- coding:utf-8 -*- import requests from bs4 import BeautifulSoup url = "http://top.baidu.com/buzz?b=1&fr=topindex" header = { "user-agent": "Mozil ...
分类:
其他好文 时间:
2020-07-06 16:29:50
阅读次数:
414
import json import pymysql import requests from bs4 import BeautifulSoup import datetime url = 'https://ncov.dxy.cn/ncovh5/view/pneumonia?from=timelin ...
分类:
其他好文 时间:
2020-07-05 10:57:17
阅读次数:
64
数据爬取 代码: Yiqing.py from os import path import requests from bs4 import BeautifulSoup import json import pymysql import time from _ast import Try url = ...
分类:
其他好文 时间:
2020-07-05 10:36:14
阅读次数:
45
import urllib.request; from bs4 import BeautifulSoup; response = urllib.request.urlopen("file:///C:/Users/junwei_zhou/Desktop/502/6.1/html.html"); htm ...
分类:
Web程序 时间:
2020-07-04 22:31:21
阅读次数:
78
'''爬取豆瓣top250书籍''' import requests import json import csv from bs4 import BeautifulSoup books = [] def book_name(url): headers = { 'User-Agent': 'Mozi ...
分类:
其他好文 时间:
2020-07-02 16:39:12
阅读次数:
70