01 强大的数据处理能力
Python有强大的数据处理能力。我们都使用过Excel,它的数据处理能力已经非常强大,不过当你使用过python的数据处理能力后,就会发现,Excel的处理效率其实很低。
举个例子。现在我们想得到下面这张图。
用Excel作图,对于3批不同的数据,需要进行3次作图设置和处理后,才能得到一张比较符合要求的图。而用Python只需要下面这3条语句。
bx=setosa.plot(kind="scatter",x="sepal_length",y="sepal_width",label="setosa",color="red",figsize=(10,5))
versicolor.plot(ax=bx,kind="scatter",x="sepal_length",y="sepal_width",label="versicolor",color="blue")
virginica.plot(ax=bx,kind="scatter",x="sepal_length",y="sepal_width",label="virginica",color="yellow")
磨刀不误砍柴功,熟练运用python需要大量的练习,那么就让我们从基础开始,学习python中的pandas包吧。
02 练习内容提要
本次学习涉及到一下pandas的基础内容,总结如下,源代码我放在github上,想要深入了解的朋友可以进去看看。
- 两种数据结构:DataFrame &,Series的基本操作函数,如建立、格式转换、索引。
- 两种数据选取方法:loc,iloc
- df.loc[["行标签"],["列标签"]]
- df.iloc[["行索引"],["列索引"]]
- 布尔型索引筛选数据:布尔型索引返回True、False,数据组会筛选True的元素行列返回
- 鸢尾花数据集的可视化处理:箱线图、散点图的绘制
03 练习代码
本次学习的代码内容很多,为了更好的可视化效果,我将代码放在了github上,感兴趣的朋友们可以点击去github上看看。
练习代码(十分建议在电脑端查看)
希望能够激发你对python的兴趣~
网友评论