以前使用Python2,一直为中文烦恼,也不知道为什么开头就要声明#coding=utf-8,后来用了Python3,发现就不用这样了,还是想彻底弄懂下这是为什么。 先讲asc码 每个 ASC码占一个字节 1个字节=8个bit 也就是说ASC码最多只有256个 表示中文肯定是不够的 ,所以后面就有了 ...
分类:
其他好文 时间:
2019-10-24 21:58:45
阅读次数:
101
1.基础入门1.1第一个Python代码 首先创建一个任意文件,结尾为py格式,然后在里面打入代码,在pycharm或者Python shell里面运行 1.2解释器编码 ascii,8位=1字节,一个英文字母是一个字节,py2的默认解释器编码就是ASCII码。 Unicode,32位=4个字节,又 ...
分类:
编程语言 时间:
2019-10-23 22:01:59
阅读次数:
171
字符串: 一个个字符组成的有序的序列,是字符的集合 使用单引号、双引号、三引号引住的字符序列 字符串是不可变对象 Python3起,字符串就是Unicode类型 字符串的定义和初始化 字符串元素访问 字符串支持使用索引访问 有序的字符集合,字符序列 可迭代 字符串连接 +连接,a=‘a’,a=‘a’ ...
分类:
编程语言 时间:
2019-10-23 20:28:55
阅读次数:
95
核心类差异 Python3对Unicode字符的原生支持 Python2中使用 ASCII 码作为默认编码方式导致string有两种类型str和unicode,Python3只支持unicode的string。python2和python3字节和字符对应关系为: 编码&字符串 字符串: py2: u ...
分类:
编程语言 时间:
2019-10-23 00:38:50
阅读次数:
131
变量命令 对于每个变量我们需要给它取一个名字。在python中,变量命名需要遵循一下这些必须遵守硬性规则和强烈建议遵守的非硬性规则。 硬性规则 变量名由字母(广义的Unicode字符,不包括特殊字符)、数字和下划线构成,数字不能开头。 大小写敏感(大写的A和小写a是两个不同的变量) 不要跟关键字(有 ...
分类:
编程语言 时间:
2019-10-20 19:57:36
阅读次数:
109
1.局部变量(lacal variable):方法或语句块内部定义的变量。生命周期是从声明位置开始到”}”为止。在使用前必须先声明和初始化(赋初值)。 2.成员变量和类变量初始值 {\u后面加上十六进制代码来表示Unicode字符。 JAVA没有直接用“\u”的而是“\u5845”,u后的4位数均为 ...
分类:
其他好文 时间:
2019-10-20 16:03:05
阅读次数:
102
本文为转发,原文地址 golang 的fmt 包实现了格式化I/O函数,类似于C的 printf 和 scanf。 golang没有 '%u' 点位符,若整数为无符号类型,默认就会被打印成无符号的。 宽度与精度的控制格式以Unicode码点为单位。宽度为该数值占用区域的最小宽度;精度为小数点之后的位 ...
分类:
其他好文 时间:
2019-10-20 11:25:32
阅读次数:
131
本文将简单介绍Python中的一个轻量级搜索工具Whoosh,并给出相应的使用示例代码。 Whoosh简介 Whoosh由Matt Chaput创建,它一开始是一个为Houdini 3D动画软件包的在线文档提供简单、快速的搜索服务工具,之后便慢慢成为一 ...
分类:
编程语言 时间:
2019-10-19 20:41:37
阅读次数:
138
引言 unicode是全世界统一的编码规则,但只规定了各种字符的数字编码(官网:www.unicode.org),具体实现的存储方式有utff-8,utf-16,utf-32等形式,各种形式有不同的存储和与unicode代码的映射规则。 中文字符范围Unicode CJK 的范围分布在多个区段中,带 ...
分类:
其他好文 时间:
2019-10-18 18:37:38
阅读次数:
258
1.utf8与utf8mb4(utf8 most bytes 4) MySQL 5.5.3之后增加了utfmb4字符编码 支持BMP(Basic Multilingual Plane,基本多文种平面)和补充字符 最多使用四个字节存储字符 utf8mb4是utf8的超集并完全兼容utf8,能够用四个字 ...
分类:
数据库 时间:
2019-10-16 17:49:45
阅读次数:
107