Python第三方库 jieba - 分词 matplotlib - 绘图 PIL - 图片处理 numpy - 矩阵运算 sqlite3 - sqlite数据库 Flask - web框架 urllib - URL处理,网页爬虫 bs4 - 解析文档-html re - 正则表达式,文字匹配 xl ...
分类:
编程语言 时间:
2020-07-18 15:31:09
阅读次数:
65
需求:我有一系列appname,想要判断这些appname是否在小米应用市场存在 解决方案:小编写了一个爬虫小程序,返回搜索第一条appname,以此判断该APP是否在小米应用市场存在。 import requestsfrom bs4 import BeautifulSoup def save_fi ...
分类:
移动开发 时间:
2020-07-14 13:39:57
阅读次数:
79
# -*- codeing = utf-8 -*- # @Time : 2020/7/9 16:43 # @Author: 小菜菜最菜 # @File : douban.py # @Software : PyCharm from bs4 import BeautifulSoup# 网页解析,获取数据 ...
分类:
其他好文 时间:
2020-07-12 22:30:01
阅读次数:
102
Python爬取博客的所有文章并存为带目录的word 文档##### import requests from bs4 import BeautifulSoup url = f'http://blog.sina.com.cn/s/articlelist_5119330124_0_1.html' wb ...
分类:
编程语言 时间:
2020-07-12 18:40:55
阅读次数:
75
from bs4 import BeautifulSoup from bs4 import Comment html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b ...
分类:
编程语言 时间:
2020-07-10 18:55:06
阅读次数:
57
import re import requests import random import time import os.path from bs4 import BeautifulSoup import pymysql user_agent_list = [ "Mozilla/5.0 (Wind ...
分类:
其他好文 时间:
2020-07-09 15:06:17
阅读次数:
72
http://www.zuihaodaxue.com/zuihaodaxuepaiming-zongbang-2020.html 代码: import requests from bs4 import BeautifulSoup import bs4 def getHTMLtext(url):#获取 ...
分类:
其他好文 时间:
2020-07-09 10:43:51
阅读次数:
61
Chrome+IE默认支持粘贴剪切板中的图片,但是我要发布的文章存在word里面,图片多达数十张,我总不能一张一张复制吧?Chrome高版本提供了可以将单张图片转换在BASE64字符串的功能。但是无法处理多张图片。而且转换成BASE64后是作为内容一起提交给服务器,不能够将图片单独保存在另外一台服务 ...
分类:
其他好文 时间:
2020-07-09 10:42:59
阅读次数:
70
爬取素材库。直接存入mysql数据库。 包含html源码直接存入数据库需要的转义函数。 替换掉源码中的html注释语句 import re import requests import random import time from bs4 import BeautifulSoup import p ...
分类:
数据库 时间:
2020-07-08 23:04:25
阅读次数:
80
import requests from bs4 import BeautifulSoup # 实现有道在线翻译 trans_url = 'http://m.youdao.com/translate' headers = {'User-Agent': 'Mozilla/5.0 (Linux; And ...
分类:
其他好文 时间:
2020-07-08 22:57:00
阅读次数:
222