知识点

时间：2021-06-03 17:37:11 阅读：0 评论：0 收藏：0 [点我收藏+]

标签：乱码文件的 sci utf-16 之间 unicode bytes nic 进制

ascii（只有英文）
A : 00000010 8位一个字节

unicode A : 00000000 00000001 00000010 00000100 32位四个字节
中：00000000 00000001 00000010 00000110 32位四个字节

utf-8 A : 00100000 8位一个字节
中 : 00000001 00000010 00000110 24位三个字节

gbk A : 00000110 8位一个字节
中 : 00000010 00000110 16位两个字节

1，各个编码之间的二进制，是不能互相识别的，会产生乱码。
2，文件的储存，传输，不能是unicode（只能是utf-8 utf-16 gbk,gb2312,asciid等）

py3:
    str 在内存中是用unicode编码。
        bytes类型
        对于英文：
             str ：表现形式：s = ‘alex‘
                    编码方式： 010101010 unicode
            bytes ：表现形式：s = b‘alex‘
                    编码方式： 000101010 utf-8 gbk。。。。

        对于中文：
             str ：表现形式：s = ‘中国‘
                    编码方式： 010101010 unicode
            bytes ：表现形式：s = b‘x\e91\e91\e01\e21\e31\e32‘
                    编码方式： 000101010 utf-8（3字节）， gbk（2字节）。。。。

知识点

标签：乱码文件的 sci utf-16 之间 unicode bytes nic 进制

原文地址：https://www.cnblogs.com/hans-learn-python/p/14843096.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行