Matplotlib入门

作者: 林清猫耳 | 来源:发表于2018-04-22 20:32 被阅读49次

    via: 保罗的酒吧 https://paul.pub/matplotlib-basics/

    入门代码示例

    import matplotlib.pyplot as plt
    import numpy as np
    
    data = np.arange(100,201)
    plt.plot(data)
    plt.show()
    
    image.png
    x = np.linspace(0, 2*np.pi,50)  # 50个元素均匀分布在[0,2pi]上
    plt.plot(x, np.sin(x))
    plt.show()
    
    image.png

    一次绘制多个图形

    有些时候,我们可能希望一次绘制多个图形,例如:两组数据的对比,或者一组数据的不同展示方式等。

    多个figure

    可以简单的理解为一个figure就是一个图形窗口。matplotlib.pyplot会有一个默认的figure,我们也可以通过plt.figure()创建更多个。如下面的代码所示:

    import matplotlib.pyplot as plt
    import numpy as np
    
    data = np.arange(100,201)
    plt.plot(data)
    
    data2 = np.arange(200,301)
    plt.figure()
    plt.plot(data2)
    
    plt.show()
    
    image.png

    多个subplot

    有些情况下,我们是希望在同一个窗口显示多个图形。此时就这可以用多个subplotsubplot函数的前两个参数指定了subplot数量,即:它们是以矩阵的形式来分割当前图形,两个整数分别指定了矩阵的行数和列数。而第三个参数是指矩阵中的索引。 下面是一段代码示例:

    import matplotlib.pyplot as plt
    import numpy as np
    
    data = np.arange(100,201)
    plt.subplot(2,1,1)
    plt.plot(data)
    
    data2 = np.arange(200,301)
    plt.subplot(2,1,2)
    plt.plot(data2)
    
    plt.show()
    
    image.png

    subplot函数的参数不仅仅支持上面这种形式,还可以将三个整数(10之内的)合并一个整数。例如:2, 1, 1可以写成211,2, 1, 2可以写成212。

    subplot函数的详细说明参见这里:matplotlib.pyplot.subplot

    在一张图上绘制多个数据集

    x = np.linspace(0, 2*np.pi,150)
    plt.plot(x, np.sin(x), x, np.sin(2*x), x, np.sin(3*x))
    plt.show()
    
    image.png
    x = np.linspace(0, 2*np.pi, 50)
    plt.plot(x, np.sin(x), 'r-^', x, np.sin(2*x), 'g--')
    plt.show()
    
    image.png

    自定义图形的外观

    上述代码展示了两种不同的曲线样式:'r-o''g--'。字母 'r''g' 代表线条的颜色,后面的符号代表线和点标记的类型。例如 '-o' 代表包含实心点标记的实线,'--' 代表虚线。

    颜色: 蓝色 - 'b' 绿色 - 'g' 红色 - 'r' 青色 - 'c' 品红 - 'm' 黄色 - 'y' 黑色 - 'k''b'代表蓝色,所以这里用黑色的最后一个字母) 白色 - 'w'

    线: 直线 - '-' 虚线 - '--' 点线 - ':' 点划线 - '-.'

    常用点标记 点 - '.' 像素 - ',' 圆 - 'o' 方形 - 's' 三角形 - '^'

    https://matplotlib.org/api/markers_api.html

    常用图形实例

    Matplotlib可以生成非常多的图形式样,多到令人惊叹的地步。

    https://matplotlib.org/gallery/index.html

    线性图

    前面的例子中,线性图的横轴的点都是自动生成的,而我们很可能希望主动设置它。另外,线条我们可能也希望对其进行定制。看一下下面这个例子:

    import matplotlib.pyplot as plt
    plt.plot([1,2,3],[3,6,9],'r')  # red
    plt.plot([1,2,3],[2,4,9],':g')  # :(点) green
    
    plt.show()
    
    image.png

    散点图

    scatter函数用来绘制散点图。同样,这个函数也需要两组配对的数据指定x和y轴的坐标。下面是一段代码示例:

    N = 20  # 点的个数
    
    plt.scatter(np.random.rand(N)*100,
               np.random.rand(N)*100,
               c='r',s=100,alpha=0.5)  # c:点的颜色  s:点的大小  alpha:点的透明度
    
    plt.scatter(np.random.rand(N)*100,
               np.random.rand(N)*100,
               c='g',s=200,alpha=0.5)
    
    plt.scatter(np.random.rand(N)*100,
               np.random.rand(N)*100,
               c='b',s=300,alpha=0.5)
    
    plt.show()
    
    image.png

    饼状图

    pie函数用来绘制饼状图。饼状图通常用来表达集合中各个部分的百分比。

    <bdi style="box-sizing: border-box;">In</bdi> [27]:

    labels = ['Mon','Tue','Wed','Thu','Fri','Sat','Sun']
    
    data = np.random.rand(7)*100
    
    plt.pie(data, labels=labels, autopct='%1.1f%%')  # autopct 指定数值的精度
    plt.axis('equal')  # 设置坐标轴大小一致
    plt.legend()  # 指明要绘制图例
    
    plt.show()
    
    image.png

    条形图

    bar函数用来绘制条形图。条形图常常用来描述一组数据的对比情况,例如:一周七天,每天的城市车流量。

    N = 7
    
    x = np.arange(7)
    data = np.random.randint(low=0, high=100, size=N)  # 生成7个0-100的随机数
    colors = np.random.rand(N*3).reshape(N,-1)  # 先生成21(N x 3)个随机数,然后将它们组装成7行,那么每行就是三个数,这对应了颜色的三个组成部分。
    labels = ['Mon','Tue','Wed','Thu','Fri','Sat','Sun']
    
    plt.title('Weekday Data')
    plt.bar(x, data, alpha=0.8, color=colors, tick_label=labels)
    plt.show()
    
    image.png

    直方图

    hist函数用来绘制直方图。直方图看起来是条形图有些类似。但它们的含义是不一样的,直方图描述了数据中某个范围内数据出现的频度。

    data = [np.random.randint(0,n,n) for n in [3000,4000,5000]]
    labels = ['3K','4K','5K']
    bins = [0,100,500,1000,2000,3000,4000,5000]
    
    plt.hist(data, bins=bins, label=labels)
    plt.legend()
    plt.show()
    
    image.png
    上面的这些代码中,[np.random.randint(0, n, n) for n in [3000, 4000, 5000]]生成了包含了三个数组的数组,这其中:
    • 第一个数组包含了3000个随机数,这些随机数的范围是 [0, 3000)
    • 第二个数组包含了4000个随机数,这些随机数的范围是 [0, 4000)
    • 第三个数组包含了5000个随机数,这些随机数的范围是 [0, 5000)
      bins数组用来指定我们显示的直方图的边界,即:[0, 100) 会有一个数据点,[100, 500)会有一个数据点,以此类推。所以最终结果一共会显示7个数据点。同样的,我们指定了标签和图例。

    在这幅图中,我们看到,三组数据在3000以下都有数据,并且频度是差不多的。但蓝色条只有3000以下的数据,橙色条只有4000以下的数据。这与我们的随机数组数据刚好吻合。

    相关文章

      网友评论

        本文标题:Matplotlib入门

        本文链接:https://www.haomeiwen.com/subject/hduclftx.html