码迷,mamicode.com
首页 >  
搜索关键字:KindEditor bs4    ( 1344个结果
BeautifulSoup4 print() 输出中文乱码解决方法
urllib.request 返回的数据需要解码,如 网站返回的是GBK编码数据. 需要调用decode("gbk") 此时输出不会乱码. with urllib.request.urlopen(url, context=context) as response: html = response.r ...
分类:其他好文   时间:2020-12-31 11:55:54    阅读次数:0
4) 爬中国大学排名网站内容
# -*- coding: utf-8 -*- import bs4 import requests from bs4 import BeautifulSoup import pandas as pd import matplotlib.pyplot as plt def getHTMLText(u ...
分类:Web程序   时间:2020-12-19 13:08:52    阅读次数:2
中国大学排名
import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url): try: r = requests.get(url,timeout=30) r.raise_for_status() # 如果状态不是200, ...
分类:其他好文   时间:2020-12-19 12:33:55    阅读次数:1
第一个爬虫程序
使用的库urllib、bs4——代码如下:fromurllib.requestimporturlopenfrombs4importBeautifulSoupasbf 发出请求,获取html(获取到的是字节,需要转换) html=urlopen("http://www.baidu.com") 用beautifulsoup将获取的内容转换为
分类:其他好文   时间:2020-12-18 13:11:18    阅读次数:3
python爬取动态图片(gif)
一、给定url,直接下载到本地 import re import requests from bs4 import BeautifulSoup def get_gif(url, a): response = requests.get(url) # 自己电脑上的文件夹路径,默认命名 a.gif wit ...
分类:编程语言   时间:2020-12-07 12:35:37    阅读次数:6
python+fastapi自建HTTP爬虫IP池接口
使用的库 bs4 requests pymongo fastapi uvicorn 爬取ip 网络上搜索一下有很多提供HTTP代理的网站,直接使用BeautifulSoup将IP爬下来。 html =requests.get(url).text bs =BeautifulSoup(html,'htm ...
分类:编程语言   时间:2020-12-02 12:09:56    阅读次数:6
Python网络爬虫的基本流程与准备
基本流程: 准备工作:(通过浏览器查看分析目标网页,学习编程基础规范) 获取数据:(通过HTTP库向目标站点发起请求,请求可以包含额外的header等信息,如果服务器能正常响应,会得到一个Response,便是所要获取的页面内容) 解析内容:(得到的内容可能是HTML、json等格式,可以用页面解析 ...
分类:编程语言   时间:2020-11-19 12:54:57    阅读次数:10
ImportError: No module named bs4错误解决方法
写一下Python如何安装模块: 1.下载BS4模块: http://www.crummy.com/software/BeautifulSoup/bs4/download/4.3/beautifulsoup4-4.3.2.tar.gz 2.解压到linux中的某个文件夹中并进入该文件夹 3 执行 p ...
分类:其他好文   时间:2020-11-18 12:37:39    阅读次数:5
百度百科-人物数据采集
import json import re import requests from urllib.parse import quote from bs4 import BeautifulSoup from pyquery import PyQuery as pq class BaiDuPerson ...
分类:其他好文   时间:2020-10-18 16:34:16    阅读次数:17
python实现对豆瓣数据的爬取
from bs4 import BeautifulSoup #网页解析,获取数据 import sys #正则表达式,进行文字匹配 import re import urllib.request,urllib.error #指定url,获取网页数据 import xlwt #使用表格 import ...
分类:编程语言   时间:2020-10-18 10:08:33    阅读次数:27
1344条   上一页 1 2 3 4 5 ... 135 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!