码迷,mamicode.com
首页 > 编程语言 > 详细

python 常用内建模块(1) base64

时间:2017-01-06 12:38:54      阅读:287      评论:0      收藏:0      [点我收藏+]

标签:url   数据   file   文本   pytho   邮件   bsp   com   pdf   

Base64是一种用64个字符来表示任意二进制数据的方法。

用记事本打开exejpgpdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编码方法。

Base64的原理很简单,首先,准备一个包含64个字符的数组:

[‘A‘, ‘B‘, ‘C‘, ... ‘a‘, ‘b‘, ‘c‘, ... ‘0‘, ‘1‘, ... ‘+‘, ‘/‘]

然后,对二进制数据进行处理,每3个字节一组,一共是3x8=24bit,划为4组,每组正好6个bit:

技术分享

这样我们得到4个数字作为索引,然后查表,获得相应的4个字符,就是编码后的字符串。

Base64编码会把3字节的二进制数据编码为4字节的文本数据,长度增加33%,好处是编码后的文本数据可以在邮件正文、网页等直接显示。如果原始数据不是3n字节则在原始数据的后面添加m(0<=m<=2)个\x00(ASCII 中的null字符)填充,并在base64编码之后添加m个=号表示补充了m个字节数据

由于标准的Base64编码后可能出现字符+/,在URL中就不能直接作为参数,所以又有一种"url safe"的base64编码,其实就是把字符+/分别变成-_

 

python 常用内建模块(1) base64

标签:url   数据   file   文本   pytho   邮件   bsp   com   pdf   

原文地址:http://www.cnblogs.com/lvxiaobo616/p/6255594.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!