美文网首页技术程序员Python点滴
简单扯扯PyCharm4.5中新加的Python Profile

简单扯扯PyCharm4.5中新加的Python Profile

作者: TypingQuietly | 来源:发表于2015-07-11 22:54 被阅读3254次

    对python开发者来说,相信大家对Jetbrains出的python编辑器PyCharm应该都有了解。对我自己来说,每天项目中都在用。自从半年前从C#转到python之后直到现在依旧还在适应,适应这门语言,适应编辑器(不过也老怀恋CSharp和VS了,MS大法也很好!)。
    这小半年下来发现其实写写python也还行的:

    • 语言本身的表达性很好,非常简洁。个人很喜欢python的装饰器,做一些横向的复用效果非常好。
    • 有活跃的开源社区,各种开源框架、开源库。

    几个月的python码下来,也养成了一些坏毛病,不管有意识还是无意识的经常很想把一大坨逻辑用一行代码解决,并不太关心代码的效率,再加上有python语言的效率本来就很差这条被大家说烂掉的观点加持,更加有恃无恐,呵呵。反过来想想,在coding的过程中多权衡,多尝试一些更好的方式,边写边重构才更能帮助你更好的coding和成长吧,而且在整个过程中有很多的乐趣,适当培养一些对代码的洁癖还是棒棒哒。
    差点都跑的没背影了,言归正传。在写代码的过程中如果碰到需要对代码执行效率权衡的话,能够量化的做一些profile就更好了,常用的一些方式有借助一些像profilehotshottimeit来手动的做一些测量,不过这样需搞有一些缺点:

    • 需要手动写一些测试的代码;
    • 需要对输出的结果进行一定的排版和美化,方便阅读;
    • 收集的信息有限

    锵锵锵,终于轮到主角出场了。
    PyCharm4.5中加入了一个新的功能 :Python Profiler,只需要运行Run | Profile…就能使用,默认支持使用cProfile,提供两种视图:StatisticsCall Graph:

    Call Graph
    Statistic
    两种视图下面显示的内容是一样的,包含函数被调用所执行的时间,次数等,只不过在”Call Graph“视图下面,代码执行过程中各个函数被调用的层次关系都被完美的显示出来,按调用耗时纵向排列,而且还辅以警告的颜色来进行提示。在各个节点上点击右键能够看到Navigate to Source的操作,点击能够导航到相应的源码处,非常方便查看代码。
    在这里我们以二叉查找树为例,展示一些比如像二叉树查找、遍历等基本操作在python profiler里面运行的效果:
    import time
    
    class Node(object):
        def __init__(self, data, left, right):
            self.data = data
            self.left = left
            self.right = right
    
        def show(self):
            return self.data
    
    class BSTree(object):
        def __init__(self):
            self.root = None
    
        def insert(self, data):
            temp_node = Node(data, None, None)
            if self.root is None:
                self.root = temp_node
            else:
                current_node = self.root
                while True:
                    parent_node = current_node
                    if data < current_node.data:
                        current_node = current_node.left
                        if current_node is None:
                            parent_node.left = temp_node
                            break
                    else:
                        current_node = current_node.right
                        if current_node is None:
                            parent_node.right = temp_node
                            break
    
        def get_min(self):
            current_node = self.root
            while current_node.left is not None:
                current_node = current_node.left
            return current_node.data
    
        def get_max(self):
            current_node = self.root
            while current_node.right is not None:
                current_node = current_node.right
            return current_node.data
    
        def find(self, data):
            current_node = self.root
            while current_node is not None:
                if current_node.data == data:
                    return current_node
                elif data < current_node.data:
                    current_node = current_node.left
                else:
                    current_node = current_node.right
            return None
    

    测试代码:

    from BSTree import BSTree
    import random
    
    def build_bst_tree(num):
        bst_tree = BSTree()
        source = list(xrange(1, num))
        while num > 0 and source:
            data = random.choice(source)
            source.remove(data)
            bst_tree.insert(data)
            num -= 1
        return bst_tree
    
    def in_order(node):
        node_str = ""
        if node is not None:
            in_order(node.left)
            print node.show(),
            in_order(node.right)
    
    my_bst_tree = build_bst_tree(500)
    in_order(my_bst_tree.root)
    my_bst_tree.get_min()
    my_bst_tree.get_max()
    my_bst_tree.find(123)
    

    依次点击菜单 Run | Profile... 会生成并打开一个xxxx.pstat的Tab,里面就是分别按StatisticsCall graph两种视图展示的profile结果:

    profile.png
    在profile的结果中我们能够看到,整个文件执行共耗时13ms,二叉树遍历in_order和二叉树生成函数build_bst_tree基本占了大部分运行的时间,占用的时间越长,节点的颜色越深,还是比较体贴的小功能。
    我们对寻找二叉树最大值节点的函数get_max稍稍修改一下,在函数体里面加一句time.sleep(5)的逻辑,拖延一下执行的时间:
    def get_max(self):
            time.sleep(5)
            current_node = self.root
            while current_node.right is not None:
                current_node = current_node.right
            return current_node.data
    

    现在再来看一下修改之后的profile的结果:

    profile2.png

    我们能够看到,在get_max的函数逻辑中加入5s的延迟之后,整个profie的结果也发生了一些改变,相应节点的时间耗时时间发生了变化,基本上增加了5s的时间.同时也能清晰的看到时间变长的原因是因为get_max里面调用了time.sleep(),而且时间过长的节点比如get_max也相应变成了红色,用来警示。
    好吧,就说到这里,仅仅是粗略的介绍了一下PyCharm里面这个新加的功能,希望能给大家一个初步印象,我相信多加利用这个方便到没朋友的功能一定能帮助我们改善自己的代码。

    相关文章

      网友评论

        本文标题:简单扯扯PyCharm4.5中新加的Python Profile

        本文链接:https://www.haomeiwen.com/subject/lmduqttx.html