1)字符串前加 ’u‘ 后面字符串以 Unicode 格式进行编码,一般用在中文字符串前面,防止乱码。 2)字符串前加 ‘r’ 声明后面的字符串是普通字符串,防止特殊字符串自带功能生效,如 ’\n‘、’\t‘,一般用在正则表达式、文件路径中使用。 示例:str1 = r'a\nb'print(str ...
分类:
编程语言 时间:
2020-03-10 01:07:57
阅读次数:
68
前言从Mysql数据库角度来说,谈到存储就一定离不开字符集,只不过在我们日常开发中统一的utf8/utf8mb4编码,使我们常常忽略了字符集的影响,本文仅从字符集的角度来谈谈对InnoDB的存储设计的一点影响,以及Mysql是怎么兼容各种字符集的。过一下字符集Unicode作为现在通用的字符集,通常采用两个字节表示一个字符,带来的副作用就是,原本采用ASCII字符集只需要一个字节的,却变成了2个字
分类:
数据库 时间:
2020-03-09 23:51:38
阅读次数:
79
public class test { //属性 public unicode_gb[] m_unicode_gb = new unicode_gb[10]; public A[] m_A = new A[10]; public class A { public int unicode; publi ...
分类:
编程语言 时间:
2020-03-09 18:15:52
阅读次数:
87
JavaScript 内部,字符以 UTF 16 的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode 码点大于0xFFFF的字符),JavaScript 会认为它们是两个字符。 上面代码中,汉字“??”(注意,这个字不是“吉祥”的“吉”)的码点是0x20BB7,UTF ...
分类:
其他好文 时间:
2020-03-09 11:50:45
阅读次数:
68
json_encode返回的中文乱码,解析不出,json_encode里面加个参数就行了 json_encode($data,JSON_UNESCAPED_UNICODE); ...
分类:
Web程序 时间:
2020-03-09 00:56:10
阅读次数:
73
1. 编码/解码( encode()/decode() ) encode() 是将 Python 内部默认的编码 unicode编码 转换成其他编码格式,decode()是将其他编码格式转换成 unicode编码,列如: strs = '一段话' print(strs.encode()) #如果没有 ...
分类:
编程语言 时间:
2020-03-07 09:59:04
阅读次数:
90
编码初识 常见编码集: 1. ascii: 不支持中文 一个字符占用 8 位 2. gbk(包含 ascii)国标码: 一个英文字符占用 8 位(1 字节) 一个中文字符占用 16 位(2 字节) 3. Unicode: 英文:4 个字节,32 位 中文:4 个字节,32 位 4. utf 8(最流 ...
分类:
其他好文 时间:
2020-03-06 22:00:21
阅读次数:
62
二次编码 编码回顾 二次编码 在 python 3 的内存中使用的是 Unicode 编码,而硬盘中存储时使用的是用户选择的编码方式[^1]。这样一来,就需要进行 Unicode 和其他编码方式的转变,也就涉及到 编码 和 解码 的问题。 编码是将字符转化为二进制的形式,使用的是 方法: 解码是将二 ...
分类:
其他好文 时间:
2020-03-06 21:44:46
阅读次数:
74
YAML不是标记语言是一种数据序列化语言,它匹配用户对数据的期望。 它旨在提供人性化,并与其他编程语言完美配合。管理数据非常有用,包括Unicode可打印字符。本章将介绍YAML及其功能。 格式 考虑下面显示的文字 - Quick brown fox jumped over the lazy dog ...
分类:
其他好文 时间:
2020-03-06 01:50:34
阅读次数:
78
一、正则常用的方法 1.match:从开始位置开始查找,一次匹配 2.sear?ch:从任何位置查找,一次匹配 3.findall?:全部匹配,返回列表 4.finditer?:全部匹配,返回迭代器 5.?split:分割字符串,返回列表 ?6.sub:替换 7.匹配中文 中文unicode编码[u ...
分类:
编程语言 时间:
2020-03-06 01:49:15
阅读次数:
67