美文网首页
Python 部分基础模块

Python 部分基础模块

作者: JackYao | 来源:发表于2017-10-19 18:12 被阅读67次

    本文就是做一个笔记,可能看起来很乱,仅供参考

    file

    # 使用 with 会保证文件被关闭
    with open(file) as f, open(file1) as f2 ...
        # do some thing with f & f1
        
        f.read() # 返回一个字符串,包含文件内所有内容
        f.read(n) # 返回文件中包含的 n 个字符/文字
        f.readline() # 读取下一个\n 之前的内容,并返回一个字符串
        f.readlines() # 读取文件,返回一个行字符串列表
        
        f.seak(n) # 光标移动到索引位置
        
    # 对于临时文件这样处理比较好,如果下面用不到这个文件对象
    for line in open(file): 
        print(line)
        
    #循环遍历文件
    f = open(file)
    for line in f: #无需调用 readlines
        print(line)
        
    #上面的代码可以简化为
    print(line) for line in f
    

    文件打开模式

    1.r只读,r+读写,不创建
    #w新建只写,w+新建读写,二者都会将文件内容清零
    #以w方式打开,不能读出。w+可读写
    
    2.**w+与r+区别:
    #r+:可读可写,若文件不存在,报错;w+: 可读可写,若文件不存在,创建
    
    3.r+与a+区别:
        fd = open("1.txt",'w+')  
        fd.write('123')  
        fd = open("1.txt",'r+')  
        fd.write('456')  
        fd = open("1.txt",'a+')  
        fd.write('789') 
    # 结果:456789
    # 说明r+进行了覆盖写
    
    4.以a,a+的方式打开文件,附加方式打开
    #a:附加写方式打开,不可读;读取报错
    #a+: 附加读写方式打开
    5. wb / wb+  rb / rb+
    # 针对二进制文件
    

    递归打印目录

    import sys, os
    # 用 walk 函数打印目录树
    def walk(currdir):
        for (thisdir, subshere, fileshere) in os.walk(currdir):
            print('thisdir-->',thisdir) #该目录下的所有的文件夹
            print('subshere-->', subshere) #当前目录下所有的子目录
            print('fileshere-->',fileshere) #当前目录下所有的文件
    
    # 利用自己写的递归函数遍历目录
    def mylister(currdir):
        print('[' + currdir + ']')
        for file in os.listdir(currdir):
            path = os.path.join(currdir, file)
            if not os.path.isdir(path): #判断是否为目录
                print(path)
            else:
                mylister(path)
    
    if __name__ == '__main__':
        mylister(sys.argv[1])
        walk(sys.argv[1])
    

    logging模块

    # 一共五种级别的日志
    logging.critical(msg)
    logging.error(msg)
    logging.warning(msg)
    logging.info(msg)
    logging.debug(msg)
    
    
    #级别排序为:CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET
    
    #默认为WARNING 级别低的不会显示在命令行
    
    #更改日志输出级别
    logging.root.setLevel(level=logging.INFO)
    

    gzip, zipfile, tarfile 模块

    zilib

    • [ ] zlib.compress(orginal_string) 对字符串进行加密
    • [ ] zlib.decompress(compressed_string) 对加密串解密

    bz2

        基本使用方法同 zilib, 作用相同,加密方式不同而已
    

    gzip

    #压缩
    content = "Lots of content here"
    with gzip.open('file.txt.gz', 'wb') as f:
        f.write(content)
    
    #解压
    with gzip.open('file.txt.gz', 'rb') as f:
        file_content = f.read()
        print file_content
      
    #将文件解压出来    
    with gzip.open('file.txt.gz', 'rb') as f_in, open('file.txt', 'wb') as f_out:
        shutil.copyfileobj(f_in, f_out)    
    
    #目录下应有 file.txt 文件,
    with open("file.txt") as f:
        print f.read()
    

    zipfile

    f = zipfile.ZipFile('files.zip','w')
    
    for file in glob.glob("*.txt"):
        f.write(file)
        # 移除压缩完的文件
        os.remove(file)
        
    f.close()
    
    f = zipfile.ZipFile('files.zip','r')
    f.namelist() #查看压缩包内子文件名 -> []
    
    for file in f.namelist():
        # 读取 file 文件中的内容
        print file, "content:", f.read(file)
    
    f.close()
    
    f.extract() #解压单个文件
    f.extractall() # 解压全部文件
    

    tarfile

    # 压缩文件
    f = tarfile.open("file.txt.tar", "w")
    f.add("file.txt")
    
    
    # 解压同 zipfile
    f.extract() #解压单个文件
    f.extractall() # 解压全部文件
    

    shutil模块

    高级文件夹操作

    • [ ] shutil.copy(src, dst) 将源文件复制到目标地址(包括文件权限)
    • [ ] shutil.copyfile(src, dst) 将源文件复制到目标地址(仅文件内容)
    • [ ] shutil.copytree(src, dst) 复制文件夹
    • [ ] os.removedirs(dst) 删除非空文件夹(必须是非空文件夹)
    • [ ] shutil.move 与 os.rename 功能差不多
    • [ ] shutil.get_archive_formats() 查看直接查看的压缩文件格式('bztar', 'gztar' ,'tar', 'xztar', 'zip')
    • [ ] shutil.make_archive("test_archive", "zip", "test_dir/") 压缩 test_dir 文件夹,以 zip 格式, 名字为 test_archive

    glob模块

    • [ ] glob.glob('*.py') 获取当前目录下所有的 py 文件
    glob 函数支持三种格式的语法:
        * 匹配单个或多个字符
        ? 匹配任意单个字符
        [] 匹配指定范围内的字符,如:[0-9]匹配数字。
    

    json模块

    • [ ] json.loads(json_string/file) 如果是 json_string 会将 json 转换成 dict 对象,如果是 file, 会从文件中读取 json 转换成 dict 对象
    • [ ] json.dumps(obj, file) 如果有 file 对象,生成 json 文件,如果没有 file将 obj 变成 json 对象

    os模块

    • [ ] os.remove(path) 或 os.unlink(path) :删除指定路径的文件。路径可以是全名,也可以是当前工作目录下的路径。
    • [ ] os.removedirs:删除文件,并删除中间路径中的空文件夹
    • [ ] os.chdir(path):将当前工作目录改变为指定的路径
    • [ ] os.getcwd():返回当前的工作目录
    • [ ] os.curdir:表示当前目录的符号
    • [ ] os.rename(old, new):重命名文件
    • [ ] os.renames(old, new):重命名文件,如果中间路径的文件夹不存在,则创建文件夹
    • [ ] os.listdir(path):返回给定目录下的所有文件夹和文件名,不包括 '.' 和 '..' 以及子文件夹下的目录。('.' 和 '..' 分别指当前目录和父目录)
    • [ ] os.mkdir(name):产生新文件夹
    • [ ] os.makedirs(name):产生新文件夹,如果中间路径的文件夹不存在,则创建文件夹
    • [ ] os.listdir(os.curdir) 当前目录下的文件
    • [ ] os.linesep 系统换行符
    • [ ] os.sep 系统分隔符
    • [ ] os.pathsep 系统环境变量分隔符
    • [ ] os.environ 环境变量(实际是一个dict)

    os.path模块:

    • [ ] os.path.isfile(path) :检测一个路径是否为普通文件
    • [ ] os.path.isdir(path):检测一个路径是否为文件夹
    • [ ] os.path.exists(path):检测路径是否存在
    • [ ] os.path.isabs(path):检测路径是否为绝对路径
    • [ ] os.path.split(path):拆分一个路径为 (head, tail) 两部分
    • [ ] os.path.join(a, *p):使用系统的路径分隔符,将各个部分合成一个路径
    • [ ] os.path.abspath():返回路径的绝对路径
    • [ ] os.path.dirname(path):返回路径中的文件夹部分
    • [ ] os.path.basename(path):返回路径中的文件部分
    • [ ] os.path.splitext(path):将路径与扩展名分开
    • [ ] os.path.expanduser(path):展开 '~' 和 '~user'

    dict模块

    创建字典
        {key:value}
        dict([(key,value),
              (key,value)])
    update
        dict[key] = value
        dict.get(key)
        
    pop
        dict.pop(key)
        
    in
        key in dict -> bool
    
    list
        dict.keys()   #['cows', 'cats', 'dogs']
        dict.values() #[1, 3, 5]
        dict.items()  #[('cows', 1), ('cats', 3), ('dogs', 5)]
        
    

    list

    创建 list
        [value1,value2]
        list()
        list([value1,value2])
    
    append
        list1 + list2 
        
    double 
        list1 * 2 #[1, 2.0, 'hello', 1, 2.0, 'hello']
    
    delect
        del list1[index]
        del list1[index:index]    
    
    in 
        value in list1 -> bool
     
    count
        a = [11, 12, 13, 12, 11]
        a.count(11)   # 2
    
    index
        a.index(11)
        
    append
        a.append(value)
        
    extend
        a = [10, 11, 12, 11]
        a.extend([1, 2]) # a = [10, 11, 12, 11, 1, 2]
    
    insert
        list1.insert(index,value)
        
    remove 
        a.remove(11) #a = [10, 12, 11, 1, 2]
    
    pop 
        a = [10, 11, 12, 13, 11]
        a.pop(2) # 12
    
    

    tuple

    创建 tuple
        t = (1,2,3,4)
        t = (1,) #(1,) tuple
        t = (1) #1 int
    get 
        t[index]
        
    del or update
        不可变
    

    set

    创建 set
        set()
        set([1,2,3,1]) #{1, 2, 3}
        {1,2,3,1} #{1, 2, 3}
        ----------
        {} # dict
        set() # set
        ----------
        frozenset([1, 2, 3, 'a', 1]) #不可变的集合
    
    add
        t = {1, 2, 3}
        t.add(value) # {1, 2, 3, 5}
        t.update([4,5,6]) # {1, 2, 3, 4, 5, 6}
        
    remove
        t.remove(value)
    
    pop
        t.pop #删除任意一个元素
    
    discard 同 remove ,移除不存在的元素不会报错
        
    union
        a = {1, 2, 3, 4}
        b = {3, 4, 5, 6}
        a.union(b) #{1, 2, 3, 4, 5, 6}
        a | b #{1, 2, 3, 4, 5, 6}
    
    intersection
        a.intersection(b) # {3, 4}
        a & b  # {3, 4}
        
    difference
        a.difference(b) # {1, 2}
        a - b # {1, 2}
        ---a - b 与 b - a并不一样,b - a 返回的是返回 b 不在 a 的元素组成的集合---
        b.difference(a) # {5, 6}
        b - a  # {5, 6}
        
    difference_update
        # 从a中去除所有属于b的元素
        a.difference_update(b)
    

    切片

    s = 'hello world'
    s[1:3] #'el'
    s[:3]  # 'hel'
    s[1:-2] #'ello wor'
    s[-3:]  #'rld'
    

    相关文章

      网友评论

          本文标题:Python 部分基础模块

          本文链接:https://www.haomeiwen.com/subject/awlpuxtx.html