美文网首页
Byte[ ]和Base64之间的转换(加密)

Byte[ ]和Base64之间的转换(加密)

作者: 中原百科 | 来源:发表于2019-04-13 11:32 被阅读0次

     Python 2.7中的str是字节串,而Python 3.x中的str是字符串

    经常听到有人说“base64加密”,其实base64并不能用于数据加密,它也不是为了纯粹的数据加密而生的,它的出现是为了解决不可见字符串的网络传输和数据保存问题。因为,用base64对数据进行转换的过程不能成为“加密”与“解密”,只能成为“编码”与“解码”。

    Base64是一种用64个字符来表示任意二进制数据的方法,它是一种通过查表对二进制数据进行编码的方法,不能用于数据加密。base64最初的出现时为了能够正确的传输邮件数据,因为邮件中的附件(比如图片)的二进制数中可能存在不可见字符(ascii码中128-255之间的值是不可见字符),比如我们尝试用记事本或其他文本编辑器打开一个图片时,通常都会看到一大堆乱码,这些乱码就是不可见字符。由于早期的一些网络设备和网络协议是无法正确识别这些字符的,这就可能在数据传输时出现各种无法预知的问题。base64的作用就是把含有不可见字符的信息用可见字符来表示(Ascii码中0-127之间的值是可见字符),从而解决这个问题

    Base64.encodeToString(str.getBytes())

    它其实是使用 a-z, A-Z, 0-9, /, + 这64个字符来进行编码的,0-63分别对应用前面的64个字符来表示。

    其编码结果的特点是:末尾可能有1个或者2个 = :

    Pz8/aGVsbG8vc2FzZXdyZWRmZGQ+Pj4uIEhlbGxvIOS4lueVjO+8gQ==

    其原因是,Base64编码算法是每次处理byte[]数组中三个连续的byte,那么就有可能 byte[] 数组不是3的整数倍,那么余数就有可能是1,或者2,所以就分别使用 一个 = 和两个 = 来进行填充。

    所以:

    Base64的编码其特点就是可能末尾有一个或者两个=,可能含有 / 和 + 字符。

    16进制编码的特点是全部由'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd', 'e', 'f' 这16个字符组成,不含其他字母。

    加密算法都是对byte[]进行变换和运算。

    有 String 转换得到的 byte[] 就一定可以使用原来的编码方案转换成原来的 String,

    但是加密的结果 byte[] 却不能用任何字符编码方案得到String, 一般使用16进制编码成String,然后进行存储或者比较。

    base64.b64encode(s, altchars=None)对二进制数据(字节串)s通过base64进行编码,返回编码后的字节串

    base64.b64decode(s, altchars=None, validate=False)对通过base64编码的字节对象或ASCII字符串s进行解码,返回解码后的字节串

    base64.urlsafe_b64encode(s)与b64encode()函数不同的是,它会把标准Base64编码结果中的字符'+'和字符'/'分别替换成字符'-'和字符'_'。

    base64.urlsafe_b64decode(s)解码通过base64.urlsafe_b64encode()函数编码的字节对象或ASCII字符串s。

    当判断字符串是否是base64加密过的,或者要将字符串进行加密。

    特别是爬虫过程中,js中经常带有base64进行加密解密的操作,只要知道整个逻辑,以后可以直接进行调用。

    def jiemi_base64(): # 解密base64

        data = 'eyduYW1lJzona2trJywnYWdlJzoyMn0='

        # data= '''{'aa':'bb'}'''

        missing_padding = 4- len(data) %4

        if missing_padding:

            data += '=' * missing_padding

        print(base64.b64decode(data))

        print(type(base64.b64decode(data)))

        #b"{'name':'kkk','age':22}"

        #<class 'bytes'>

    def jiami_base64(): # 加密base64

        data= "{'name':'kkk','age':22}"

        print(base64.b64encode(data.encode()))  # data必须是bytes类型,如果是字符串,则通过encode()转换

        # b'eyduYW1lJzona2trJywnYWdlJzoyMn0='

    if __name__ == '__main__':

        # jiami_base64()

        jiemi_base64()

    由于‘z’后面bit位都是0,base64约定以‘=’代替

    上述还可以写为:

    以24位,8位分割表示:

    01111010     00000000     00000000

    以24位,6位分割表示:

    011110    100000    000000    000000

    6位如何以8位形式表示,在前面补0,即:

    0001 1110    0010 0000    0000 0000    0000 0000

    得到上述结果

    因此,‘z’经过base64编码得到:‘eg==’

    用python验证一下:

    >>> base64.b64encode("z")

    'eg=='

    ---------------------

    作者:zhubaoJay

    来源:CSDN

    原文:https://blog.csdn.net/zhubaoJay/article/details/72957135

    版权声明:本文为博主原创文章,转载请附上博文链接!

    相关文章

      网友评论

          本文标题:Byte[ ]和Base64之间的转换(加密)

          本文链接:https://www.haomeiwen.com/subject/gyzhwqtx.html