美文网首页
Base64详解

Base64详解

作者: 峰峰小 | 来源:发表于2016-10-09 21:34 被阅读1254次

    ** Base64用于将二进制数据编码成ASCII字符 ** (图片、文件等都可转化为二进制数据)
    传输信道只支持ASCII字符,不方便传输二进制流的场合。
    含有非ASCII字符,容易出现编码问题的场合。(中文字符)

    Base64编码说明

    Base64编码要求把3个8位字节(3X8=24)转化为4个6位的字节(4X6=24),之后在6位的前面补两个0,形成8位一个字节的形式。 如果剩下的字符不足3个字节,则用0填充,输出字符使用'=',因此编码后输出的文本末尾可能会出现1或2个'='。

    为了保证所输出的编码位可读字符,Base64制定了一个编码表,以便进行统一转换。编码表的大小为2^6=64,这也是Base64名称的由来。

    Base64.png

    Base64要求把每三个8Bit的字节转换为四个6Bit的字节(3 X 8 = 4 X 6 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。

    ** 举例 **

    下面是一个简单的base64编码实例。在这里,三个字符组成的输入值“Ow!”是base64编码的,得到的是4个字符的base64编码值“T3ch”。它是按以下方式工作的。

    • (1) 字符串"zrf"被拆分成3个8位的字节(0x7A、0x72、0x66)。
    • (2) 这3个字节构成了一个24为的二进制01111010 01110010 01100110。
    • (3) 这些为被划分为一些6位的序列011110、100111、0010 01、100110。
    • (4) 每个6位值都表示了从0~63之间的数字,“ 30,39,9,38 ”对应base64字母表中的64个字符之一。
      得到的base64编码字符串是4个字符的字符串“enJm”。

    然后就可以通过线路将这个字符串作为“安全的”8位字符传送出去,因为只用了一些移植性最好的字符(字母、数字等)。

    原文的字节数量应该是3的倍数啊,如果这个条件不能满足的话,那该怎么办呢?

    我们的解决办法是这样的:原文的字节不够的地方可以用全0来补足,转换时Base64编码用=号来代替。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为:

    ** 余数 = 原文字节数 MOD 3 **

    所以余数任何情况下都只可能是0,1,2这三个数中的一个。如果余数是0的话,就表示原文字节数正好是3的倍数(最理想的情况啦)。如果是1的话,为了让Base64编码是3的倍数,就要补2个等号;同理,如果是2的话,就要补1个等号。

    各种下载软件地址

    先以“迅雷下载”为例: 很多下载类网站都提供“迅雷下载”的链接,其地址通常是加密的迅雷专用下载地址。

    thunder://QUFodHRwOi8vd3d3LmJhaWR1LmNvbS9pbWcvc3NsbTFfbG9nby5naWZaWg==

    其实迅雷的“专用地址”也是用Base64加密的,其加密过程如下:

    ** ps:**

    标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。

    为解决此问题,可采用一种用于URL的改进Base64编码,它不在末尾填充'='号,并将标 准Base64中的“+”和“/”分别改成了“*”和“-”,这样就免去了在URL编解码和数据库存储时所要作的转换,避免了编码信息长度在此过程中的增 加,并统一了数据库、表单等处对象标识符的格式。

    另有一种用于正则表达式的改进Base64变种,它将“+”和“/”改成了“!”和“-”,因为“+”,“*”以及前面在IRCu中用到的“[”和“]”在正则表达式中都可能具有特殊含义。

    此外还有一些变种,它们将“+/”改为“-”或“.”(用作编程语言中的标识符名称)或“.-”(用于XML中的Nmtoken)甚至“_:”(用于XML中的Name)。

    相关文章

      网友评论

          本文标题:Base64详解

          本文链接:https://www.haomeiwen.com/subject/vfqpyttx.html