美文网首页
09-python文件I/O-基础

09-python文件I/O-基础

作者: 老张_Jason | 来源:发表于2018-05-01 12:56 被阅读57次

    概述

    我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。

    有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:

    #1. 打开文件,得到文件句柄并赋值给一个变量
    #2. 通过句柄对文件进行操作
    #3. 关闭文件
    

    一、打开和关闭文件

    Python 提供了必要的函数和方法进行默认情况下的文件基本操作。你可以用 file 对象做大部分的文件操作。

    • open 函数

    你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。语法:

    file object = open(file_name [, access_mode][, buffering])
    各个参数的细节如下:

    • file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
    • access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。
    • buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。

      不同模式打开文件的完全列表: image.png
    image.png
    • File对象的属性

    一个文件被打开后,你有一个file对象,你可以得到有关该文件的各种信息。

    以下是和file对象相关的所有属性的列表: image.png 如下实例:
    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
     
    # 打开一个文件
    fo = open("foo.txt", "w")
    print "文件名: ", fo.name
    print "是否已关闭 : ", fo.closed
    print "访问模式 : ", fo.mode
    print "末尾是否强制加空格 : ", fo.softspace
    

    以上实例输出结果:

    文件名:  foo.txt
    是否已关闭 :  False
    访问模式 :  w
    末尾是否强制加空格 :  0
    
    • close()方法

    File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。

    当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。用 close()方法关闭文件是一个很好的习惯。

    语法:

    fileObject.close()
    例子:

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
     
    # 打开一个文件
    fo = open("foo.txt", "w")
    print "文件名: ", fo.name
     
    # 关闭打开的文件
    fo.close()
    

    以上实例输出结果:

    文件名: foo.txt

    读写文件:
    file对象提供了一系列方法,能让我们的文件访问更轻松。来看看如何使用read()和write()方法来读取和写入文件。

    • write()方法

    write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。

    write()方法不会在字符串的结尾添加换行符('\n'):

    语法:

    fileObject.write(string)
    在这里,被传递的参数是要写入到已打开文件的内容。

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
     
    # 打开一个文件
    fo = open("foo.txt", "w")
    fo.write( "www.runoob.com!\nVery good site!\n")
     
    # 关闭打开的文件
    fo.close()
    

    上述方法会创建foo.txt文件,并将收到的内容写入该文件,并最终关闭文件。如果你打开这个文件,将看到以下内容:

    $ cat foo.txt 
    www.runoob.com!
    Very good site!
    
    • read()方法

    ead()方法从一个打开的文件中读取一个字符串。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。

    语法:

    fileObject.read([count])
    在这里,被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入,如果没有传入count,它会尝试尽可能多地读取更多的内容,很可能是直到文件的末尾。
    例子:
    这里我们用到以上创建的 foo.txt 文件。

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
     
    # 打开一个文件
    fo = open("foo.txt", "r+")
    str = fo.read(10)
    print "读取的字符串是 : ", str
    # 关闭打开的文件
    fo.close()
    

    以上实例输出结果:

    读取的字符串是 : www.runoob

    • 文件定位

    tell()方法告诉你文件内的当前位置, 换句话说,下一次的读写会发生在文件开头这么多字节之后。

    seek(offset [,from])方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。

    如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。
    例子:

    就用我们上面创建的文件foo.txt。

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
     
    # 打开一个文件
    fo = open("foo.txt", "r+")
    str = fo.read(10)
    print "读取的字符串是 : ", str
     
    # 查找当前位置
    position = fo.tell()
    print "当前文件位置 : ", position
     
    # 把指针再次重新定位到文件开头
    position = fo.seek(0, 0)
    str = fo.read(10)
    print "重新读取字符串 : ", str
    # 关闭打开的文件
    fo.close()
    

    以上实例输出结果:

    读取的字符串是 :  www.runoob
    当前文件位置 :  10
    重新读取字符串 :  www.runoob
    
    • 案例2:seek()方法使用案例
    my_open = open(file_name3, 'w+')  
    #打开fie_name3路径下的my_test.txt文件,以读写方式  
    #若文件不存在,创建,若存在,覆盖  
    #实际上我们的确没有这个文件  
    print('position_1 : ', my_open.tell())  
    #返回当前在文件中的位置  
    my_open.write('line_1\n')  
    print('position_2 : ', my_open.tell())  
    my_open.write('line_2\n')  
    print('position_3 : ', my_open.tell())  
      
    try:  
        my_open.seek(-len('line_2\n'), 1)  
        '''''seek()可以在文件中移动文件指针指针 
        从whence(0 代表文件开始 1 代表当前位置 2 代表文件末尾)偏移off字节 
        off为正往结束方向移动,为负往开始方向移动 
        这里表示从当前位置往开始方向移动8字节'''  
        print('position_4 : ', my_open.tell())  
        read1 = my_open.readline()  
        #从文件中读取并返回一行  
        print(read1, '\nposition_5 : ', my_open.tell())  
        my_open.seek(off = 0, whence = 0)  
        #回到最开始  
        read2 = my_open.readline()  
        print(read2, '\nposition_6 : ', my_open.tell())  
    except IOError as e:  
        print(e,'\n',   
        '意为:对于非二进制的文本文件,不允许使用偏移定位。')  
        print('position_4 : ', my_open.tell())  
      
    my_open.close()  
    

    输出结果如下:

    position_1 :  0
    
    position_2 :  8
    
    position_3 :  16
    
    can't do nonzero cur-relative seeks
    
     意为:对于非二进制的文本文件,不允许使用偏移定位。
    
    position_4 :  16
    

    ---------------为了解决这种情况,我们建立一个二进制文件------------------------

    my_open = open(file_name3, 'wb+')  
    #读写打开或建立一个二进制文件,允许读和写  
    print('position_1 : ', my_open.tell())  
      
    try:  
        my_open.write('line_1\n')  
        print('position_2 : ', my_open.tell())  
        my_open.write('line_2\n')  
        print('position_3 : ', my_open.tell())  
        my_open.seek(-len('line_2\n'), 1)  
        print('position_4 : ', my_open.tell())  
        read1 = my_open.readline()  
        print(read1, '\nposition_5 : ', my_open.tell())  
        my_open.seek(off = 0, whence = 0)  
        read2 = my_open.readline()  
        print(read2, '\nposition_6 : ', my_open.tell())  
    except TypeError as e:  
        print(e, '\n',  
              '意为:需要的是一个字节的对象,不是“str”')  
    my_open.close()  
    

    输出结果如下:

    D:\python\venv\Scripts\python.exe D:/python/file02-seek方法.py
    position_1 :  0
    a bytes-like object is required, not 'str' 
     意为:需要的是一个字节的对象,不是str
    
    Process finished with exit code 0
    

    说明:

    Python文件使用“wb+”方式打开,写入字符串会报错,因为这种打开方式为:以二进制格式打开一个文件只用于写入。
    如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。所以写入的字符类型需为二进制格式,如:
    f.write("hello".encode('ascii'))
    写入的编码范围不为128以内,就不能使用ascii了
    如:
    fh.write("汉字".encode('UTF-8'))

    my_open = open(file_name3, 'wb+')  
    print('position_1 : ', my_open.tell())  
    my_open.write('line_1\n'.encode('ascii'))  
    print('position_2 : ', my_open.tell())  
    my_open.write('line_2\n'.encode('ascii'))  
    print('position_3 : ', my_open.tell())  
    my_open.seek(-len('line_2\n'), 1)  
    print('position_4 : ', my_open.tell())  
    read1 = my_open.readline()  
    print(read1, '\nposition_5 : ', my_open.tell())  
    my_open.seek(0, 0)  
    read2 = my_open.readline()  
    print(read2, '\nposition_6 : ', my_open.tell())  
    my_open.close()  
    ##检查是否正确写入  
    my_open = open(file_name3, 'r')  
    #读取file_name3路径下的my_test.txt文件  
    my_infor = my_open.readlines()  
    my_open.close()  
    print(my_infor) 
    

    输出结果如下:

    D:\python\venv\Scripts\python.exe D:/python/file02-seek方法.py
    position_1 :  0
    position_2 :  7
    position_3 :  14
    position_4 :  7
    b'line_2\n' 
    position_5 :  14
    b'line_1\n' 
    position_6 :  7
    ['line_1\n', 'line_2\n']
    
    Process finished with exit code 0
    
    • Python File(文件) 方法
    file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数: image.png image.png

    补充内容

    • 在 write 内容后,直接 read 文件输出会为空,是因为指针已经在内容末尾。
      两种解决方式: 其一,先 close 文件,open 后再读取,其二,可以设置指针回到文件最初后再 read
    # -*- coding: UTF-8 -*-
    
    import os;
    
    document = open("testfile.txt", "w+");
    print "文件名: ", document.name;
    document.write("这是我创建的第一个测试文件!\nwelcome!");
    print document.tell();
    #输出当前指针位置
    document.seek(os.SEEK_SET);
    #设置指针回到文件最初
    context = document.read();
    print context;
    document.close();
    
    • 为了保证无论是否出错都能正确地关闭文件,我们可以使用 try ... finally 来实现:
    try:
        f = open('/path/to/file', 'r')
        print f.read()
    finally:
        if f:
            f.close()
    

    但是每次都这么写实在太繁琐,所以,Python 引入了 with 语句来自动帮我们调用 close() 方法:

    with open('/path/to/file', 'r') as f:
        print f.read()
    
    • 强调

    #强调第一点:
    打开一个文件包含两部分资源:操作系统级打开的文件+应用程序的变量。在操作完毕一个文件时,必须把与该文件
    的这两部分资源一个不落地回收,回收方法为:
    1、f.close() #回收操作系统级打开的文件
    2、del f #回收应用程序级的变量
    
    其中del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件还没有关闭,白白占用资源,
    而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,
    一定要记住f.close()
    
    刚开始的时候很容易忘记f.close()方法去关闭,推荐傻瓜式操作方式:使用with关键字来帮我们管理上下文
    with open('a.txt','w') as f:
        pass
     
    with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
        data=read_f.read()
        write_f.write(data)
    
    #强调第二点:
    f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作
    系统说了算了,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-8。
    若要保证不乱码,文件以什么方式存的,就要以什么方式打开。
    
    f=open('a.txt','r',encoding='utf-8')
    

    相关文章

      网友评论

          本文标题:09-python文件I/O-基础

          本文链接:https://www.haomeiwen.com/subject/irexrftx.html