美文网首页
《Python编程快速上手—让繁琐工作自动化》第9章实践项目答案

《Python编程快速上手—让繁琐工作自动化》第9章实践项目答案

作者: Wuhouxxxx | 来源:发表于2017-10-30 23:25 被阅读0次

    9.4 项目:将带有美国风格日期的文件改名为欧洲风格日期

    项目要求:上千个文本文件,文件名包含美国风格的日期( MM-DD-YYYY),需要将它们改名为欧洲风格的日期( DD-MM-YYYY)

    #! python3
    # change data format from A_style to E_style
    
    import shutil, os, re
    
    dateRegex = re.compile(r"""
        ((0|1)?\d)-         # month
        ((0|1|2|3)?\d)-     # day
        ((19|20)\d\d)       # year
        """, re.VERBOSE)
    
    for amerfilename in os.listdir('.'):
        euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename)
        if euroFilename == amerfilename:
            continue
        abswd = os.path.abspath('.')
        amerfilename = os.path.join(abswd, amerfilename)
        euroFilename = os.path.join(abswd, euroFilename)
    
        print('rename "%s" to "%s"' % (amerfilename, euroFilename))
        shutil.move(amerfilename, euroFilename)
    

    思路:

    1. 上面的解决方案和书中给的有些不同,代码更加精简
    2. euroFilename = dateRegex.sub(r'\3-\1-\5', amerfilename),亮点就是用“\数字”来进行位置对换;而书中给了大量中间变量,浪费了内存空间(个人意见)
    3. 这个好好琢磨,还是很有意思的,大家可以交流有无更优解

    9.5 项目:将一个文件夹备份到一个 ZIP 文件

    项目要求:假定你正在做一个项目,它的文件保存在 C:\AlsPythonBook 文件夹中。你担心工作会丢失, 所以希望为整个文件夹创建一个 ZIP 文件, 作为“快照” 。你希望保存不同的版本, 希望 ZIP 文件的文件名每次创建时都有所变化。

    #! python3
    # backup a folder to zip
    
    import zipfile, os
    
    def backuptozip(folder):
        folder = os.path.abspath(folder)
        os.chdir(folder)
        number = 1
        while True:
            zipFilename = os.path.basename(folder) + '_' + str(number) + '.zip'
            if not os.path.exists(zipFilename):
                break
            number += 1
    
        print('Creating %s...' % (zipFilename))
        backupZip = zipfile.ZipFile(zipFilename,'w')
    
        for root, dirs, files in os.walk(folder):
            print('Adding files in %s...' % root)
            backupZip.write(root.replace(folder,'.\\'))
    
            for file in files:
                newBase = os.path.basename(folder) + '_'
                if file.startswith(newBase) and file.endswith('.zip'):
                    continue
                backupZip.write(os.path.join(root.replace(folder,'.\\'),file))
    
        backupZip.close()
        print('to_zip Done!')
    
    backuptozip('old')
    

    思路:

    1. 此项目书中已经给了详细的解答
    2. 主要是zipfile和os.walk的掌握

    9.8.1 实践项目:选择性拷贝

    项目要求:编写一个程序,遍历一个目录树,查找特定扩展名的文件(诸如.pdf 或.jpg),不论这些文件的位置在哪里, 将它们拷贝到一个新的文件夹中。

    #! python3
    # selective copy
    
    import os, shutil
    os.chdir('old')
    # to generate a file, and make sure the file has not existed
    try:
        os.makedirs('copy_to_this_dir')
    except FileExistsError:
        pass
    # walk throgh a dir and find particular file, like '.pdf','.txt', etc.
    for root, dirs, files in os.walk('.'):
        for file in files:
    # what kind of file that you want to copy
            if file.endswith('.bak') or file.endswith('.dat'):
    # 这一步很重要,是为了排除自己复制成自己(因为os.walk的直线遍历性)
                if file not in os.listdir('copy_to_this_dir'):
    # copy these files to a new folder
                    shutil.copy(os.path.join(root,file),'copy_to_this_dir')
    

    思路:

    1. 当时做这个作业居然几乎每步都写了注释,已经十分详尽
    2. 主要就是注意FileExistsError和“排除自己复制成自己”这两点

    9.8.2 实践项目:删除不需要的文件

    项目要求:编写一个程序,遍历一个目录树,查找特别大的文件或文件夹, 比方说, 超过100MB 的文件 (回忆一下,要获得文件的大小,可以使用 os 模块的 os.path.getsize())。将这些文件的绝对路径打印到屏幕上。

    #! python3
    # list oversized file in particular folder(and delete it)
    
    import os
    
    for root, dirs, files in os.walk('.'):
        for file in files:
            file_name = os.path.join(root, file)
            if os.path.getsize(file_name) > 1024*1024:
                print(file_name)
    

    思路:

    1. 这个项目很简单,就是os.path.getsize的运用
    2. 1024*1024,这个很小,因为当时我练习时的文件中文件都是几k,按需放大即可
    3. 这个只是找出,并没有加入删除的代码

    9.8.3 实践项目:消除缺失的编号

    项目要求:编写一个程序, 在一个文件夹中, 找到所有带指定前缀的文件, 诸如 spam001.txt,spam002.txt 等,并定位缺失的编号(例如存在 spam001.txt 和 spam003.txt,但不存在spam002.txt)。让该程序对所有后面的文件改名,消除缺失的编号。

    #! python3
    # complete the filename that contain sequence like'spam001','spam003'
    
    import os, re, shutil
    os.chdir('spam')
    
    # 找到指定文件夹中所有带指定前缀的文件
    o_filenames = [x for x in os.listdir('.') if '.' in x and 
                    x.startswith('abc')]
    print(o_filenames)
    
    # 定位缺失的编号
    numRegex = re.compile(r'^abc(.*?).txt$')
    o_num_list = []
    for o_filename in o_filenames:
        t_name_re = numRegex.search(o_filename)
        o_num_list.append(t_name_re.group(1))
    print(o_num_list)
    
    n_num_list = []
    for i in range(1,len(o_num_list)+1):
        t_i = '%03d' % i
        n_num_list.append(t_i)
    print(n_num_list)
    
    for i in n_num_list:
        if i not in o_num_list:
            print("abc%s.txt" % i)
    
    # 对文件改名以消除缺失的编号
    for i,v in zip(o_num_list, n_num_list):
        shutil.move('abc%s.txt'%i, 'abc%s.txt'%v)
    
    print('Rename project is done!')
    

    思路:

    1. 当初构思了这道题挺久,然后网上找了答案结果找不到理想的,有个同学的答案不够简洁优美。就自己认真专研了,结果写出来很有成就感
    2. 找到指定文件夹中所有带指定前缀的文件:用了列表生成器[x for x in os.listdir...]来简化代码
    3. 定位缺失的编号:用了两个列表来装origin和not-origin的编号;t_i = '%03d' % i 这个能用0来填充成三位数
    4. 对文件改名以消除缺失的编号:用了zip来并列修改文件名字,也是极大简化了代码

    就是因为9.8.3这道题,我才决定发博客和更多人交流。相较于一位网上同学的答案,此代码亮点在’%03d’和zip()函数的使用,还有任务拆分清晰。 做了个把小时的,代码还算满意,激励下自己继续努力。 如有错误,请指出以相互学习,多谢!


    环境:python3

    想做这个系列文章,就是因为当时看这本书时,想看看网上有没更优美的解决,但是略难找到。所以就把自己的项目练习放在了一个txt文件中,现在把练习代码放到这里,有不足之处希望大家能给出指导意见及相互交流、提升。

    相关文章

      网友评论

          本文标题:《Python编程快速上手—让繁琐工作自动化》第9章实践项目答案

          本文链接:https://www.haomeiwen.com/subject/sqkmpxtx.html