最近利用python抓取一些网上的数据,遇到了编码的问题。非常头痛,总结一下用到的解决方案。 linux中vim下查看文件编码的命令 set fileencoding python中一个强力的编码检测包 chardet ,使用方法非常简单。linux下利用pip install chardet实现简 ...
分类:
编程语言 时间:
2018-10-10 19:11:25
阅读次数:
191
python实践中经常出现编码相关的异常,大多网上找资料而没有理解原理,导致一次次重复错误。本文对常用Unicode、UTF-8、GB2312编码的原理进行介绍,接着介绍了python字符类型unicode和str以及常见编解码错误UnicodeEncodeError和UnicodeDEcodeEr... ...
分类:
编程语言 时间:
2018-10-07 13:49:53
阅读次数:
165
1、解释器路径:#!/usr/bin/env python 2、编码:# -*- coding:utf8 -*- (p2有中文需要加,p3不需要) 3、单行注释用# 4、多行注释用”””, 例如:”””这是注释的内容””” 5、a = 4 ** 4,4的4次方, 结果a = 256 6、/和//的区 ...
分类:
编程语言 时间:
2018-10-06 14:27:47
阅读次数:
175
恢复内容开始 何为模块?一个模块就是包含了python定义和声明的文件,文件名就是模块加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1.使用python编码的代码(.py文件) 2.一杯编译为共享库或DLLD的C或C++扩展 3.包好一组模块的包 4.使用c编写并链接到pyth ...
分类:
其他好文 时间:
2018-09-21 17:41:41
阅读次数:
287
何为模块?一个模块就是包含了python定义和声明的文件,文件名就是模块加上.py的后缀. 但其实import加载的模块分为四个通用类别: 1.使用python编码的代码(.py文件) 2.一杯编译为共享库或DLLD的C或C++扩展 3.包好一组模块的包 4.使用c编写并链接到python解释器的内 ...
分类:
其他好文 时间:
2018-09-21 17:39:31
阅读次数:
182
读取文件时碰到问题: 1.(unicode error) 'unicodeescape' codec can't decode bytes in position 16-17: truncated \uXXXX escape 在stackoverflow上找到了答案,就是将在路径字符串前加 r : ...
分类:
其他好文 时间:
2018-09-17 19:43:36
阅读次数:
2788
1.基础 输出 print(‘孙云增’,‘哈哈’) # ‘,’输出为空格 输人 name = input(‘提示的内容’) /浮点除法 %.6f //地板除法 整除 % 取余 python编码问题 (采用Unicode编码) ord(‘A’) = 65 chr(65) = ‘A’ len(str) ...
分类:
编程语言 时间:
2018-09-12 13:54:13
阅读次数:
186
python2 在文件头部加 # -*- coding:utf8 -*- 才能解析中文,python 3 不需要 原因:python2默认用AsciLL,8位,最多表示256 ascill 00000000 8位表示 u... ...
分类:
编程语言 时间:
2018-09-11 18:01:39
阅读次数:
157
pep8规范 pep8规范 官方文档:https://www.python.org/dev/peps/pep-0008/ PEP8中文翻译:http://www.cnblogs.com/ajianbeyourself/p/4377933.html 以下内容转自 https://www.douban. ...
分类:
编程语言 时间:
2018-09-07 14:04:46
阅读次数:
171
Camp时在python2的编码上坑了不少。 理解pyhon2的编码 python3的编码 Python 2 将 strings 处理为原生的 bytes 类型,而不是 unicode, Python 3 所有的 strings 均是 unicode 类型。 utf-8编码兼容ascii编码,ass ...
分类:
编程语言 时间:
2018-09-01 12:17:01
阅读次数:
156