pip 批量安装 将待安装的包按照下面的格式保存在 requests.txt 文件中 chardet==4.0.0 idna==2.10 requests==2.25.1 urllib3==1.26.2 在该文件的目录下运行下面的指令 pip install -r requests.txt ...
分类:
其他好文 时间:
2021-01-26 11:39:10
阅读次数:
0
51job多线程爬取指定职业信息数据 # datetime:2020/10/7 14:02 # 51job多线程 import requests import chardet from bs4 import BeautifulSoup import csv from openpyxl import ...
分类:
编程语言 时间:
2020-10-07 21:39:48
阅读次数:
43
.txt文件原本的编码格式为国标或者ANSI,需要转换为utf-8,防止中文乱码。 只要修改path路径为.txt文件所在目录即可。 如果出现**No module named 'chardet'错误,先执行pip install chardet**安装这个库。 注意:如果.txt文件本身已经是ut ...
分类:
其他好文 时间:
2020-08-02 16:10:52
阅读次数:
122
""" 使用urllib.request()请求一个网页内容,并且把内容打印出来。 """ from urllib import request import chardet if __name__ == '__main__': # 有的网站url使用不了 url = "https://www.cn ...
分类:
Web程序 时间:
2020-07-19 23:19:06
阅读次数:
78
返回页面乱码问题 方案一 import requests headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.1 ...
分类:
其他好文 时间:
2020-06-26 14:27:40
阅读次数:
47
使用selenium 完成12306自动登录 运行环境 python3.7 pycharm 需要安装以下包 pip install -r requirements.txt certifi==2020.4.5.1 chardet==3.0.4 idna==2.9 Pillow==7.1.2 reque ...
分类:
其他好文 时间:
2020-06-07 14:58:56
阅读次数:
68
常用库: Chardet 字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama 主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable 主要用于在终端或浏览器端构建格式化的输出。 difflib,[Python]标准库,计算文本差异Levenshtein,快速计算 ...
分类:
编程语言 时间:
2020-06-03 15:25:32
阅读次数:
89
f3 = open(file=path,mode='rb') data = f3.read() # print(data) f3.close() result = chardet.detect(data) print(result) 结果: {'encoding': 'Big5', 'confide ...
分类:
其他好文 时间:
2020-05-07 10:51:49
阅读次数:
74
导出pip安装的所有的包: pip freeze > piplist.txt 在新的环境中安装导出的包 pip install -r piplist.txt astroid==2.3.3autopep8==1.5beautifulsoup4==4.9.0certifi==2020.4.5.1char ...
分类:
其他好文 时间:
2020-05-05 20:00:03
阅读次数:
310
库名称简介 Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable主要用于在终端或浏览器端构建格式化的输出。 difflib,[Python]标准库,计算文本差异 Levenshtein,快速计算字 ...
分类:
编程语言 时间:
2020-04-07 22:07:20
阅读次数:
108