美文网首页
python遍历文件夹及其子目录

python遍历文件夹及其子目录

作者: 一平曲 | 来源:发表于2019-01-20 14:49 被阅读0次

    1. os.listdir(path)

    返回指定的文件夹包含的文件或文件夹的名字的列表

    2. walk(top, topdown=True, onerror=None, followlinks=False)

    参数

    • top 是你所要遍历的目录的地址
    • topdown 为真,则优先遍历top目录,否则优先遍历top的子目录(默认为开启)
    • onerror 需要一个 callable 对象,当walk需要异常时,会调用
    • followlinks 如果为真,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)

    os.walk 的返回值是一个生成器(generator),也就是说我们需要不断的遍历它,来获得所有的内容。
    每次遍历的对象都是返回的是一个三元组(root,dirs,files)

    • root 所指的是当前正在遍历的这个文件夹的本身的地址
    • dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
    • files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

    一个使用例子,利用生成器,每次用.next()取得一个返回值,送入函数处理,直到所有的值已取得:

    root_dirs_files = os.walk(folderpath)
    while True:
        try:
            your_function(root_dirs_files.__next__())
        except StopIteration:
            break
    

    一个小提示:在python 3.x中 generator(有yield关键字的函数则会被识别为generator函数)中的next变为next了,next是python 3.x以前版本中的方法

    3. 另附os.path模块

    os.path.abspath(path) #返回绝对路径
    os.path.basename(path) #返回文件名
    os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。
    os.path.dirname(path) #返回文件路径
    os.path.exists(path) #路径存在则返回True,路径损坏返回False

    os.path.lexists #路径存在则返回True,路径损坏也返回True
    os.path.expanduser(path) #把path中包含的""和"user"转换成用户目录
    os.path.expandvars(path) #根据环境变量的值替换path中包含的”name”和”{name}”
    os.path.getatime(path) #返回最后一次进入此path的时间。
    os.path.getmtime(path) #返回在此path下最后一次修改的时间。
    os.path.getctime(path) #返回path的大小
    os.path.getsize(path) #返回文件大小,如果文件不存在就返回错误
    os.path.isabs(path) #判断是否为绝对路径
    os.path.isfile(path) #判断路径是否为文件
    os.path.isdir(path) #判断路径是否为目录

    os.path.islink(path) #判断路径是否为链接
    os.path.ismount(path) #判断路径是否为挂载点()
    os.path.join(path1[, path2[, ...]]) #把目录和文件名合成一个路径
    os.path.normcase(path) #转换path的大小写和斜杠
    os.path.normpath(path) #规范path字符串形式
    os.path.realpath(path) #返回path的真实路径
    os.path.relpath(path[, start]) #从start开始计算相对路径
    os.path.samefile(path1, path2) #判断目录或文件是否相同
    os.path.sameopenfile(fp1, fp2) #判断fp1和fp2是否指向同一文件
    os.path.samestat(stat1, stat2) #判断stat tuple stat1和stat2是否指向同一个文件
    os.path.split(path) #把路径分割成dirname和basename,返回一个元组
    os.path.splitdrive(path) #一般用在windows下,返回驱动器名和路径组成的元组
    os.path.splitext(path) #分割路径,返回路径名和文件扩展名的元组
    os.path.splitunc(path) #把路径分割为加载点与文件
    os.path.walk(path, visit, arg) #遍历path,进入每个目录都调用visit函数,visit函数必须有
    3个参数(arg, dirname, names),dirname表示当前目录的目录名,names代表当前目录下的所有
    文件名,args则为walk的第三个参数

    os.path.supports_unicode_filenames #设置是否支持unicode路径名

    参考:
    python中os.walk的用法
    python os.path模块

    相关文章

      网友评论

          本文标题:python遍历文件夹及其子目录

          本文链接:https://www.haomeiwen.com/subject/ehpxjqtx.html