标签:交互式 encoding 编码格式 image except tps 技术 文件 查看
关于使用python输出中文字符的问题:
Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。
解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 # coding=utf-8 就行了
关于三种python编程实现的方法:
1.交互式编程:
不需要创建脚本文件,是通过python解释器的交互模式来编写代码。
2.脚本式编程:
通过脚本参数调用解释器开始执行脚本,直到脚本执行完毕。当脚本执行完成后,解释器不再有效。
写一个简单的 Python 脚本程序。所有 Python 文件将以 .py 为扩展名。将以下的源代码输入至 test.py 文件中。
3.使用pycharm来进行编程:
下面来分享一个简单的python项目:
参考博客地址:https://blog.csdn.net/weixin_42515907/article/details/88083440
#coding=utf-8 import requests url = "https://item.jd.com/3112072.html" try: r = requests.get(url) r.raise_for_status() #查看状态信息,返回的是200,说明返回信息正确并且已经获得该链接相应内容。 r.encoding = r.apparent_encoding #查看编码格式,这个格式是jbk,说明我们从http的头部分已经可以解析出网站信息。 print(r.text[:1000]) except: print("爬取失败")
爬取结果:
标签:交互式 encoding 编码格式 image except tps 技术 文件 查看
原文地址:https://www.cnblogs.com/990906lhc/p/12286919.html