美文网首页
pythonの鉴黄之路(二)——图片转base64码

pythonの鉴黄之路(二)——图片转base64码

作者: 星星在线 | 来源:发表于2017-12-31 00:17 被阅读0次

    上篇博客的YCbCr鉴黄有些过于浮夸

    http://blog.csdn.net/sm9sun/article/details/53319959

    于是经过慎重决定,我们打算采取调用外部成熟的接口来完成鉴黄,这里就涉及数据传输的问题,当然不可能传图片啦~

    为了便于网络通信,我们采取将图片转为Base64码再进行后续的工作~

    先介绍一下Base64码:

    Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。Base64编码可用于在HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了Base64来将一个较长的唯一标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码具有不可读性,即所编码的数据不会被人用肉眼所直接看到。

    转码过程例子:
    38=46
    内存1个字符占8位
    转前: s 1 3
    先转成ascii:对应 115 49 51
    2进制: 01110011 00110001 00110011
    6个一组(4组) 011100110011000100110011
    然后才有后面的 011100 110011 000100 110011
    然后计算机是8位8位的存数 6不够,自动就补两个高位0了
    所有有了 高位补0
    科学计算器输入 00011100 00110011 00000100 00110011
    得到 28 51 4 51
    查对下照表 c z E z
      先以“迅雷下载”为例: 很多下载类网站都提供“迅雷下载”的链接,其地址通常是加密的迅雷专用下载地址。
    其实迅雷的“专用地址”也是用Base64"加密"的,其过程如下:
    一、在地址的前后分别添加AA和ZZ
    二、对新的字符串进行Base64编码
    另: Flashget的与迅雷类似,只不过在第一步时加的“料”不同罢了,Flashget在地址前后加的“料”是[FLASHGET]
    而QQ旋风的干脆不加料,直接就对地址进行Base64编码了

    python自带的base64模块内置了此部分功能

    import sys
    import os
    import base64 
    f=open(sys.argv[1],'rb')
    ls_f=base64.b64encode(f.read())
    f.close()
    
    file_object = open('base64.txt', 'w')
    file_object.write(ls_f)
    file_object.close( )
    
    print ls_f
    
    image image

    原文地址:http://m.blog.csdn.net/sm9sun/article/details/53321678

    相关文章

      网友评论

          本文标题:pythonの鉴黄之路(二)——图片转base64码

          本文链接:https://www.haomeiwen.com/subject/rwqogxtx.html