美文网首页程序员
0112编程-windows和mac的python文件读写编码

0112编程-windows和mac的python文件读写编码

作者: zhyuzh3d | 来源:发表于2019-01-12 21:17 被阅读76次

    点击这里进入人工智能嘚吧嘚目录,观看全部文章


    在python编程中,苹果macOS(linux、unix..)的系统默认文件数据读写编码是utf-8,而windows系统默认是gbk。所以很多在mac中正常运行的with open...却可能在mac下出错。

    下面是mac和win的几个对比:

    读取所有文件列表

    • macOS

    import os
    files=os.listdir('/Users/zhyuzh/Desktop/Jupyter/tutor/jobui/')
    
    • windows

    import os
    files=os.listdir(r'C:\Users\zhyuzh\Desktop\Jupyter\tutor\jobui')
    

    mac的路径是正斜杠/,win的路径是反斜杠\,而字符串的反斜杠还有转义的功能,比如\n表示换行,所以必须开头加r'...'确保格式不变,另外也要注意win下面的文件夹路径不要以反斜杠结尾。

    读取文件数据

    • macOS
    with open('./jobui/12384.html','r') as f:
            html=f.read()
    

    -windows

    with open('./jobui/12384.html','rb') as f:
            html=f.read().decode('utf-8')
    

    在windows下以byte形式读取字节,rb,所以f.read()得到的是字节形式的字符串,等同于b开头的字节bytestr=b'...',所以然后需要使用utf-8解码.decode('utf-8')

    将数据写入文件

    • macOS

    with open('/jobui/12839.html', 'w') as f:
            f.write(res.text)
    
    • windows

    with open('/jobui/12839.html', 'w',encoding='utf-8') as f:
            f.write(res.text)
    

    macOS默认就是utf-8编码,而windows则需要显式的添加encoding='utf-8'参数。

    最后,是json.dumps和json.loads两个方法似乎并不受到编码影响,待验证。


    点击这里进入人工智能DBD嘚吧嘚目录,观看全部文章


    每个人的智能新时代

    如果您发现文章错误,请不吝留言指正;
    如果您觉得有用,请点喜欢;
    如果您觉得很有用,欢迎转载~


    END

    相关文章

      网友评论

        本文标题:0112编程-windows和mac的python文件读写编码

        本文链接:https://www.haomeiwen.com/subject/idthdqtx.html