美文网首页
python 编程技巧(一)

python 编程技巧(一)

作者: 你常不走的路 | 来源:发表于2018-01-05 13:29 被阅读16次

    如何在字典,列表,集合中 筛选数据

    运行在ipython中

    常规 filter 列表解析

    # 如何在列表,字典,集合中根据条件筛选数据?
    from random import randint
    
    # 常规
    data = [1, 2, 34, 56, -1]
    x = []
    for v in data:
        if v > 0:
            x.append(v)
    print(x)
    
    # filter
    data = [randint(-10, 10) for _ in range(10)]
    timeit filter(lambda x: x >= 0, data)
    
    #列表解析
    timeit ([x for x in data if x>= 0])
    
    #对于字典筛除某些元素
    d={x:randint(60,100) for x in range(1,21)}
    {for k,v in d.items() if v >90}
    
    #集合筛选 data 是上面的数据
    s = set(data)
    {for x in s if s % 3 ==0 and s!=0}
    

    如何为元组中的每个元素命名,提高程序可读性

    以学生信息 为例

    
    student = ('jim',16,'male','x@x.com')
    #name
    student[0]
    #age
    student[1]
    #sex
    student[2]
    #可读性很差  所以我们可以使用
    name,age,sex,email = range(4)
    这样我们插叙 就可以使用
    student[name]  #可读性就高了
    

    还可以利用namedtuple

    from collections import namedtuple
    Student = namedtuple('Student',['name','age','sex',email'])
    s = Student('jim',16,'male','x@x.com')
    s2 = Student(name='jim',age=16,sex='male',email='x@x.com')
    #name
    s.name
    #age
    s.age
    isinstance(s,tuple) #他们两个是一个类型
    

    这里是使用了 collections 中的namedtuple 命名元组
    这样也行

    如何统计序列中的元素的出现额度?

    dict.fromkeys()

    from random import randint
    data = [randint(20) for _ in range(30)]
    #创建字典  使用data中的每一个元素作为key 值为0
    c = dict.fromkeys(data,0) 
    for x in data:
        c[x] +=1
    #遍历data中所有的值 然后 每遇到一个值 就在c[x]中进行加一
    

    如果要查询 出现频率最高的值 我们就可以使用更好的方法

    Counter and most_common

    from collections import Counter
    c2 = Counter (data)  #也是一个字典 但是它直接做了 c的事,直接做了词频统计   c2 跟c 是一样的
    c2.most_common(3)  #出现频率最高的三个元素 非常简单好用
    

    文本文件 词频统计

    #在网上随便找一篇 英文文章 保存本地来使用
    from collections import Counter
    import re
    txt = open('son.txt'),read()
    c3 = Counter(re.split('\W',txt))  #进行频率统计
    c3.most_common(10)  #查询最高频率的十个单词
    

    对字典进行排序

    方法1 sorted

    #对学生成绩进行排序  字典 对应一个学生名 一个成绩
    from random import randint
    s = {x:randint(60,100) for x in range('xyzabc')}  #这样就得到了6个小朋友的成绩
    #使用sorted排序  如果直接使用sorted
    sorted(s) #那么只会比较  xyzabc 这些 不会比较 后面的成绩
    #因此我们需要 把 字典变为元组  (95,‘a’) 这样的形式 就可以进行比较了 
    #使用zip方法
    c = zip(d.values(),d.keys())  #如果不成功就在zip 前面加上 list()  同样在py2 中可以使用itervalues来更好
    sorted(c) #这样就进行排序了
    

    方法二 sorted key的用法

    s.items() #直接得到 元组 但是 这个元组是 ('a',95) 名字在前 所以我们还需要 sorted中有一个key方法
    sorted(s.items(),key= lambda x:x[1])  #这里的x[1] 就是比较 元组索引位  1 的值 就是 成绩
    

    相关文章

      网友评论

          本文标题:python 编程技巧(一)

          本文链接:https://www.haomeiwen.com/subject/eiajnxtx.html