为什么是Python?
Python是一种多用途的编程语言,广泛应用于数据科学,被称为本世纪最性感的工作。数据科学家通过大数据集挖掘,以获得洞察力并做出有意义的数据驱动决策。Python是一种通用的编程语言,用于Web开发、网络建设、科学计算等领域。我们将进一步讨论python中的一系列令人敬畏的库,例如用于数据操作和争论的numpy、ciply和大熊猫,以及用于数据可视化的matplotlib、seABON和bokeh。
不管你你用Python做什么,首先你必须要入门Python,所以小编准备了一份Python入门学习资料,进群:943752371即可获取!
从零开始学习Python用于数据科学,Python比你想象的要强大!因此,Python&R只是用作数据科学的工具,但作为数据科学家,您需要更多地了解数据的统计和数学方面,而且除了所有方面之外,还必须具备良好的领域知识。
在我的这篇文章中,我将为用Python学习数据科学铺平道路,并将分享一些有用的资源来学习它。记住,数据科学的学习需要时间,不可能在一个月左右完成,它需要大量的实践、奉献和自信。所以永远不要放弃和快乐的学习。
步骤1:学习python的基础知识
Python是一种很容易开始使用的语言,但是掌握这些成语需要时间,就像任何其他语言一样。因此,作为新手,首先您需要了解语言的所有基础知识,一个良好的开端是遵循以下教程:
补习点
&
Google Python类
一旦完成了本教程,那么是时候迈出更大的一步,了解更复杂、更实时的python用法了,最好是少读一些书和博客文章:
书籍:
a)学习Python的硬道
b)用Python实现镗孔的自动化
博客:
a)前20位Python博客
b)我最喜欢的博客之一 : 丹巴德
第二步:基本统计与数学
强烈建议学习统计数据,并将重点放在编写示例上,最好是在Python或R.
最著名的是统计学习系列。这是一个很好的入门统计建模/机器学习与应用,在R.阅读ISLR之前,首先跳到ESLR。
(A)统计学习简介
b)统计学习的要素
如果你想要一件Python重的东西,请看这本书“思考统计”(ThinkStats)。
这是一个很好的MOOC来学习数据科学所需的基本统计数据:
— R专业化统计
利用这个可怕的可汗学院系列来复习你的高中统计和数学知识:
高中统计
步骤3:用于数据分析的Python
一旦你完成了第一步和第二步,那么是时候用一些真正的东西弄脏你的手了,首先你需要安装Anaconda
Anaconda下载
Anaconda的优势:
a)用户级安装所需的python版本
(B)能够完全独立于系统库或管理特权来安装/更新软件包
(C)附带Numpy、Sciy、PyQt、SpyderIDE等。或者在Minimal/alacarte版本(Miniconda)中,您可以在需要时安装您想要的东西。
这是Anaconda附带的工具:
a)木星笔记本IPython笔记本现在被称为木星笔记本。它是一个交互式的计算环境,在这个环境中,您可以将代码执行、富文本、数学、情节和丰富的媒体结合在一起。
您可以在本地使用此笔记本进行数据分析和绘图,并将数据可视化并最终共享。
- 安装Anaconda之后,从终端打开IPython笔记本:
- 在默认浏览器中打开笔记本:
- 在笔记本单元格中执行Python代码
(B)Numpy
NumPy是Python用于科学计算的基本包。除其他外,其中包括:
1)一个强大的N维数组对象。
2)精密(广播)功能
3)C/C+和Fortran代码集成工具
4)有用的线性代数、傅里叶变换和随机数能力
URL:Numpy
c)熊猫
熊猫是一个为Python编程语言编写的用于数据操作和分析的软件库。
查看我在那里的位置,获得关于Pandas的简单而简短的介绍。
URL:熊猫
书:用于数据分析的Python
d)Matplotlib
Matplotlib是一个Python2D绘图库,它以各种硬拷贝格式和跨平台交互环境生成出版物质量数字。Matplotlib可以用于Python脚本、Python和IPython shell、jupyter笔记本、Web应用服务器和四个图形用户界面工具包。
URL:Matplotlib
查看我的位置,获得关于matplotlib的简单而简短的介绍。
e)海运
Seborn是一个基于matplotlib的Python可视化库。它为绘制有吸引力的统计图形提供了一个高级界面。
URL:海航
请查看使用上述所有库进行数据分析的木星笔记本电脑的以下数字:
(A)使用PADAS导入数据:
从零开始学习Python用于数据科学,Python比你想象的要强大!(B)数据分析和清理:
从零开始学习Python用于数据科学,Python比你想象的要强大!(C)使用Ploly绘制图表(或者,还可以使用matplotlib和海运)
从零开始学习Python用于数据科学,Python比你想象的要强大!c)在木星笔记本上绘制方框图、条形图和热图
第4步:机器学习
机器学习是一门让计算机在不被明确编程的情况下行动的科学。机器从大量的培训数据中学习,并帮助对新的数据集进行预测或分类。
它分为以下两类:
(I)监督学习(参数/非参数算法、支持向量机、核、神经网络)。
(2)无监督学习(聚类、降维、推荐系统、深度学习)。
安装PythonScikit学习朱庇特笔记本中机器学习练习图书馆。它有非常好的文件可循:
从零开始学习Python用于数据科学,Python比你想象的要强大!最佳MOOC首先:
a)斯坦福机器学习
b)基于Udacity的机器学习介绍
关于这个问题有很多书可读,而且都写得很好,所以我不想特别推荐任何一本书。所有的书都同样适合阅读和阅读。
第五步:实践与实践
最后但并非最不重要的是,练习和艰苦的工作是关键,很多次我在Reddit&Quora上看到了一些问题,所以我可以从哪里获得用于分析的开源数据。我们是在2017年,到处都是丰富的数据,只是你需要挑选这些数据,并开始玩弄它。我个人最喜欢练习的是卡格尔。在这里,您可以自己学习,并查看内核,以查看一些最好的数据科学家的工作。
网友评论