matplotlib作为python中可视化最经典的库,是个不得不学习的东西。尽管长江后浪推前浪,涌现出了很多更好的可视化库,比如Plotly。不过,它们几乎全是建立在matplotlib的基础之上的。
饼图
from matplotlib import pyplot as plt
import ch
ch.set_ch() #自定义汉字字体
plt.figure(figsize=(6,9)) #调节图形大小,宽,高
labels = [u'第一部分',u'第二部分',u'第三部分'] #定义饼状图的标签,标签是列表
sizes = [60,30,10] #每个标签占多大,会自动去算百分比
colors = ['red','yellowgreen','lightskyblue']
explode = (0.05,0,0) #将某部分分离出来, 使用括号,将第一块分割出来,数值的大小是分割出来的与其他两块的间隙
patches,l_text,p_text = plt.pie(sizes,explode=explode,labels=labels,colors=colors,
labeldistance = 1.1,autopct = '%3.1f%%',shadow = False,
startangle = 90,pctdistance = 0.6)
#labeldistance,文本的位置离圆心有多远,1.1指1.1倍半径的位置
#autopct,圆里面的文本格式,%3.1f%%表示小数有三位,整数有一位的浮点数
#shadow,饼是否有阴影
#startangle,起始角度,0,表示从0开始逆时针转,为第一块。一般选择从90度开始比较好看
#pctdistance,百分比的text离圆心的距离
#patches, l_texts, p_texts,为了得到饼图的返回值,p_texts饼图内部文本的,l_texts饼图外label的文本
#改变文本的大小
#方法是把每一个text遍历。调用set_size方法设置它的属性
for t in l_text:
t.set_size(30)
for t in p_text:
t.set_size(20)
# 设置x,y轴刻度一致,这样饼图才能是圆的
plt.axis('equal')
plt.legend()
plt.show()
画出来的图,格式是这样的。
Figure_1.png该注意到的东西,我在代码后面都有了注释,不做过多解释。这里再强调一个无法显示中文的问题。大家注意到我不止引入了matplotlib这个库,还有一个ch。这个文件是我自定义的。内容如下。
#-*-coding:utf-8-*-
#文件名: ch.py
def set_ch():
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题</span>
里面的字体是可以随便改的,有了这个包,在主程序里运行ch.set_ch()就解决问题了。
条形图
fig = plt.figure(1)
ax1 = plt.subplot(111)
data = movie_count
width = 0.5
x_bar = np.arange(len(movie_count))
rect = ax1.bar(left=x_bar, height=data, width=width, color="lightblue")
for rec in rect:
x = rec.get_x()
height = rec.get_height()
ax1.text(x + 0.1, 1.02 * height, str(height))
ax1.set_xticks(x_bar)
ax1.set_xticklabels(movie_year, rotation=30)
ax1.set_ylabel("num")
ax1.set_title("TOP 250 movie year distribution")
ax1.grid(True)
ax1.set_ylim(0, 50)
fig.get_tight_layout()
plt.show()
这是我之前做的一个小项目,可视化的条形图,他所反映的是豆瓣前250部电影的上映年数分布。
Figure_2.png可以发现,这里面的横坐标标签是斜着的。其实可以想象,如果我不让他们斜着,它们便会互相重叠,分外难看。这里面涉及到一个参数的使用。是这个语句。
ax1.set_xticklabels(movie_year, **rotation=30**)
这个问题也是困扰了我很久的,最近才发现这个参数可以自定义坐标标签的位置,翻转角度等等,非常实用。
折线图
import matplotlib.pyplot as plt
y1=[10,13,5,40,30,60,70,12,55,25]
x1=range(0,10)
x2=range(0,10)
y2=[5,8,0,30,20,40,50,10,40,15]
plt.plot(x1,y1,label='Frist line',linewidth=3,color='r',marker='o',markerfacecolor='blue',markersize=12)
plt.plot(x2,y2,label='second line')
plt.xlabel('Plot Number')
plt.ylabel('Important var')
plt.title('Interesting Graph\nCheck it out')
plt.legend()
plt.show()
结果如下。
Figure_3.png大家看到,这是一张对比两条折线的图。看过我文章的同学应该都记得,上一篇我还写了一种用表格直接画多条折线的方法。对比起来,确实是表格更加简单哇。
总结
matplotlib能画的图还有很多,比如散点图,比如直方图,比如三维散点图,这里就不一一提及了。不过需要给大家mark一下的是,要想学好matplotlib画图,首先深入了解numpy、pandas是必不可少的。只有将这三个库联系起来,才能把可视化水平,提高一个层次。
网友评论