base64
是将原串以三个字符一组,转化成24个二进制位再分成四个字符的编码方式。
下图就是将Man
字符转为TWFu
的过程。
在很多时候,其实原字串的长度都不是3的倍数,这时候转出来的二进制位长度必然不是24的整数倍。这时候就需要对二进制位进行补零操作。在6个二进制位都为零的时候,base64中就呈现=
号。
例如
只有M
字符时,转出来的编码为TQ==
。
只有Ma
字符时,转出来的编码为TWE=
。
以上是编码规则,解码也是类似的,因为在编码的时候,已经严格的让字符串长度保持在4n。所以只需要将4个字符组成一组,再生成3个字符就可以完成解码了。
但值得注意的是,上面所说的6个二进制位都为零呈现=
号,是指全部6个0都是补的时候
,才成立的,在base64对照表中,0对应A
也是其中的编码规则之一。
如何理解全部6个0都是补的
当转码时,只有字符L
时,转出来的编码为TA==
,而非T===
,是因为在A的前两个二进制0
中,是由L
提供的。所以这就是base64为什么不可能编出三个=
号结尾的字串的原因。
再看一个例子,如何理解文章标题不等串解码相同
,举一例:
当然M
的base64编码结果不可能是TR==
,但TR==
的解码确实就是M
,这里不相信以上结果的同学,可以去尝试一下将TQ==
与TR==
进行base64解码,会发现得出的结果都是M
。
原因就出在补=
号的前置条件全部6个零都是补的
,在TR==
的二进制中,在转化24位二进制时,只有前8位是生效的,而R
和Q
的不同位在12位,若要使TR
成立,则TR
后必不能跟=
号,得出字符串应该是TRA=
。
网友评论