这是跟着数据挖掘小组学习的第二周。主要内容是Python数据分析基础。包括:1.Python基础(安装、基本用法、基本数据结构)2.Pandas基础(包括安装环境、Pandas的数据结构)3.实践(包括描述性数据分析、计算中位数等等)。
之前在公众号里抽奖,抽中了一本书《谁说菜鸟不会数据分析(Python篇)》,真正解了燃眉之急。对于只有在若干年前接触过C语言的我,在一周时间之内尽快了解Python,还要付诸实践进行统计分析,这样的要求实在是有点高。幸亏手上有这本书,要不然就远远的被甩在后面了。
2019年7月25日开始学习,当时只在慕课网上面听过几节课,了解了“人生苦短,我用Python”,学到了int、float和str数据类型。看到小组中大家晒着代码,一个个都好高大上的样子。然而在安装了Python之后使用IDE编写代码的过程中,发现自己写代码的环境怎么跟大家的不一样。问了老公原来大家都在用Pycharm,于是怒装Pycharm。然而竟然还存在注册激活的问题,又问了老公之后才发现原来还可以使用community版本——Google员工都用这个,足够自己这个小小白用了。开始看书之后发现书中建议大家使用Anaconda,其中整合了Spyder、Jupyter、R等等,并且做数据的人大多都在用Spyder,因为有专门的显示数据框架的panel,所以果断转向了Spyder。
以下为“实践”板块学习的内容:
![](https://img.haomeiwen.com/i4194404/b4cfc0788359ad9f.jpg)
——percentile和quantile之间有什么关系?——可以用下图中的1250与上图中25%数值的1242.5相比,就能明白了。
![](https://img.haomeiwen.com/i4194404/51e69c8707f5d6a6.jpg)
待完全学完之后再来一份总结。现在的多种数据分析方法才刚刚开始学。
网友评论