python的文件操作

作者: 我只是我笔下的小丑 | 来源:发表于2018-12-14 17:54 被阅读1次

    0. 概述

    文件的操作:
    关于一个文件的一生:

    文件的诞生,创建文件。在linux下可以使用touch、vim等命令进行创建。使用python,可以使用open的操作进行创建。
    文件的修改,此处只说明python的相关操作。

    1. 打开文件,open()
    2. 修改文件,write()
    3. 读取文件,read()
    4. 关闭文件,close()

    文件的结束。linux下使用rm命令进行删除。

    1.open

    open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

    open()是相关操作中参数最多,也是最复杂的一个方法。
    file:文件名称;
    mode:打开文件时候,文件具有的属性;
    buffering:缓冲区;
    encoding: 编码,仅文本模式使用;
    errors:什么样的编码会被屏蔽;
    newline:换行符的转换,进文本模式使用;
    closefd:关闭文件描述符;
    opener:

    其中最常使用的是前5个参数,文件名不可缺省。各项缺省值如下:
    open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)

    1. file

    此处使用文件的相对路径和绝对路径均可,建议使用绝对路径。
    如果不指定路径,则默认当前路径。当前路径也是相对路径开始的地方。

    2. mode

    文件访问的两种模式:

    1. 文本模式
      连续的字符,字符流。按照字符处理。
    2. 二进制模式
      字节流,将文件按照字节理解。

    mode
    r:只读打开,不存在会抛出异常,默认(正常思维的打开方式);

    w:只写打开,文件不存在时候创建,文件存时且有内容就先清空。 只写(永远打开的是一个空文件);
    x:创建文件,并且只写打开,文件存在则报错。 只写(文件不能存在,创建并打开的是一个空文件);
    a:文件存在,则追加。文件不存在时候,创建文件。 只写(永远都是写在最后);
    b:使用二进制模式打开;
    t:缺省的,使用文本模式打开;
    + 读写打开一个文件,给原来只读。只写方式打开提供,缺省的读写能力。

    只写打开的文件是不能读的。

    程序是如何定位打开时候的位置呢?
    文件内部都维护了一个指针,可以理解为windows下的光标位置。
    当:
    mode = r,指针(光标)放在文本的最前面。可以从开始一个一个的读出来。
    mode = a,指针(光标)放在文本的最后边。如果此时加一个可读的权限,能读出来什么呢?

    tell() 可以告诉我,这个这个打开的文件的指针位置。

    f = open('../tmp/test','a+')
    print(f.tell())
    print(f.writable())  
    print(f.read())  
    
    f.close()
    ##说明1:此处文本的内容为:i love python
    ##说明2:打开的文件使用完毕后必须第一时间调用close关闭。
    
    14
    True
    

    3. seek()

    seek() 英文意思:往或朝…而去,此处可以移动我们的指针(光标)。
    seek(offest,[whence])
    offest:偏移的字节量;
    whence:从什么位置开始。

    seek控制字节是很好使用的,但是文本模式下就很麻烦了。
    文本模式下:
    whence 0:缺省值,此时offest只能是正整数;
    whence 1:表示当前位置开始,offest只能是0(毫无意义);
    whence 2:表示从末尾开始,offest只能说0。

    文本模式

    f = open('../tmp/test','a+')  #默认是文本模式
    print(f.tell())
    f.seek(1) #表示指针移到第二个字节开始的位置。
    print(f.tell())
    print(f.writable())  
    print(f.read())  
    f.close()
    
    14
    1
    True
     love python
    

    字符模式

    f = open('../tmp/test1','ab+')  #b是bytes的缩写,字节模式
    print(f.tell())
    f.seek(-10,2)  #从末尾位置向前移到10个字符,1表示当前位置,0是默认值,不能接受负数了。
    print(f.tell())
    print(f.read()) 
    f.close()
    
    ##文件内容是:我爱python,向前移动10个字符。python\n是7个字符,爱是三个字符。
    
    print(b'\xe7\x88\xb1'.decode())
    
    ##说明:二进制模式下,seek不允许向前超界,向后允许。
    
    13
    3
    b'\xe7\x88\xb1python\n'
    爱
    

    4. buffering

    buffering参数是写入文件时候的缓冲控制,文件写入的时候先保存到内存中,当存到一定的数量时候,就会写入硬盘。
    缺省值是 -1。
    二进制模式下,默认大小是4096或者8192个字节。
    文本模式下,如果说终端设备,行缓存模式。非终端设备,使用二进制策略,一个汉字大多数算三个字符。

    1. buffering = 0 只在二进制模式下使用,关闭buffer;
    2. buffering = 1 只在文本模式下使用,表示开启行缓冲,见到换行符就保存(flush)到硬盘中;
    3. buffering > 1 用于指定buffer的大小。
    # 查看默认的缓存区大小
    import io
    f = open('../tmp/test1','ab+')
    print(io.DEFAULT_BUFFER_SIZE)
    
    
    
    8192
    

    注意:

    1. 文本模式,一般都使用默认缓冲区大小;
    2. 二进制模式,都是一个个字节的操作,可以指定buffer的大小;
    3. 一般来说,默认缓冲区大小说个比较好的选择,除非明确知道要干什么;
    4. 一般编程中,明知道需要写入磁盘,都会手动调用flush操作。

    flush()

    把缓存全部写入磁盘,调用close关闭文件时,会自动先执行一次flush再关闭文件。

    2. write()

    write(s)把字符串s写入到文件中保存并返回字符个数。

    3. read()

    read(size=-1)
    size表示读取多少个字符(t模式)或者字节(b模式)出来,负数或者None表示从指针处全部读出。

    f = open('../tmp/test1','r+')  #b是bytes的缩写,字节模式
    f.seek(6)  #移动两个汉字,6个字符
    print(f.read(6)) 
    f.close()
    
    #文本内容,我爱python
    
    python
    

    readline(size=-1)
    使用一次读取一行的内容;

    f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式
    
    print(f.readline()) 
    print(f.readline()) 
    f.close()
    
    #文本内容:
    # 我爱python
    # i my mykernel
    
    我爱python
    
    i my mykernel
    

    readlines(size=-1)
    一次性读出所有的行,并以列表的形式输出;

    f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式
    
    print(f.readlines()) 
    f.close()
    
    #文本内容:
    # 我爱python
    # i my mykernel
    
    ['我爱python\n', 'i my mykernel\n']
    

    4. close()

    close()

    关闭打开中的文件,如果文件并未打开,调用了也不会产生异常。

    5. 其他

    seekable() 测试是否可seek
    readable() 测试是否可读
    writable() 测试是否可写
    closed 测试是否已经关闭

    f = open('../tmp/test2','r+')  #b是bytes的缩写,字节模式
    
    print(f.seekable())
    print(f.readable())
    print(f.writable())
    print(f.closed)
    print(f.readlines()) 
    
    f.close()
    print(f.closed)
    #文本内容:
    # 我爱python
    # i my mykernel
    
    True
    True
    True
    False
    ['我爱python\n', 'i my mykernel\n']
    True
    
    f = open('../tmp/test2','r')  #b是bytes的缩写,字节模式
    
    print(f.seekable())
    print(f.readable())
    print(f.writable())
    print(f.closed)
    print(f.readlines()) 
    
    f.close()
    print(f.closed)
    #文本内容:
    # 我爱python
    # i my mykernel
    
    True
    True
    False
    False
    ['我爱python\n', 'i my mykernel\n']
    True
    
    f = open('../tmp/test2','a')  #b是bytes的缩写,字节模式
    
    print(f.seekable())
    print(f.readable())
    print(f.writable())
    print(f.closed)
    f.close()
    print(f.closed)
    #文本内容:
    # 我爱python
    # i my mykernel
    
    True
    False
    True
    False
    True
    

    更多欢迎访问:http://www.mykernel.cn/

    相关文章

      网友评论

        本文标题:python的文件操作

        本文链接:https://www.haomeiwen.com/subject/quaghqtx.html