前言
这个问题需要有一定爬虫基础有一定了解的人,对Python在数据分析上也有一定的能力。
数据分析其实更的时候是数据处理部分,然后是模型的应用,最后是数据可视化。我们就从数据分析使用到python的几个过程来着手提高相关的能力。
数据处理部分
数据分析首先需要数据。数据可以来自许多来源——数据库、文件、网络等。首先,让我们看看数据库。在DB2中有主流关系数据库MySQL,在非关系数据库中有MongoDB和Hadoop。这样,我们就需要知道python是如何连接到相应的数据库的,比如mysql。我们可以使用mysqldb库来操作mysql数据库。
![](https://img.haomeiwen.com/i15184619/fa27fa9c241e36bf.png)
python的可视化有很多库可以支持,seaborn、ggplot、matplotlib等都可以得到优美的图形,像下面使用seaborn得到的图形。
![](https://img.haomeiwen.com/i15184619/a2a0c41d5b09158d.png)
小编推荐一个学python的学习qun 740322234
无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!
网友评论