标签:-- style gbk 字节 返回 utf-8 rect 转义字符 nic
由一系列字符组成的不可变序列容器,存储的是字符的编码值。
字节byte:计算机最小存储单位,等于8 位bit.
字符:单个的数字,文字与符号。
字符集(码表):存储字符与二进制序列的对应关系。
编码:将字符转换为对应的二进制序列的过程。
解码:将二进制序列转换为对应的字符的过程。
编码方式:
--ASCII编码:包含英文、数字等字符,每个字符1个字节。
--GBK编码:兼容ASCII编码,包含21003个中文;英文1个字节,汉字2个字节。
--Unicode字符集:国际统一编码,旧字符集每个字符2字节,新字符集4字节。
--UTF-8编码:Unicode的存储与传输方式,英文1字节,中文3字节。
ord(字符串):返回该字符串的Unicode码。
chr(整数):返回该整数对应的字符串。
""" 字符串编码 ord(字符串):返回该字符串的Unicode码。 chr(整数):返回该整数对应的字符串。 """ # 字 -编码-> 数 code_value = ord("祁") print(code_value) # 31041 # 数(十进制) -解码-> 字 char = chr(31041) print(char)
字面值以及转义字符:
改变字符的原始含义。
\’ \” \””” \n \\ \t \0 空字符
原始字符串:取消转义。
a = r”C:\newfile\test.py”
""" 字面值:表面的写法 小数:1.5 1*e-5 整数:10 0b10 0x10 字符串: """ # 单引号 str02 = ‘悟空‘ # 双引号 str01 = "悟空" # 三引号:可见即所得(注释) str03 = ‘‘‘悟空‘‘‘ str03 = """悟空""" print(""" * * ** ** *** *** **** **** """) # 1. 单引号内的双引号不算结束符 # 2. 双引号内的单引号不算结束符 message = "我叫‘祁天暄‘." message = ‘我叫"祁天暄".‘ message = ‘‘‘xx"xx"xxx‘xxx‘xxxxx‘‘‘ # 转义字符: \" \‘ \\ \n换行 message = "我叫\"祁天暄\"." print(message) #我叫"祁天暄". message = "我叫\n祁天暄." print(message)#我叫(\n换行)祁天暄 # url = "c:\a\b\c\d.txt" # 错误\a \b 是其他转义字符 # url = "c:\\a\\b\c\d.txt" url = r"c:\a\b\c\d.txt" #取消转义 print(url)
标签:-- style gbk 字节 返回 utf-8 rect 转义字符 nic
原文地址:https://www.cnblogs.com/luxiaowei/p/12838726.html