成都数据分析师培训，为什么数据科学家们选择了Python语言?

作者: f46294cfe85d | 来源:发表于2018-11-09 16:18 被阅读1次

Python是一种解释型、动态语言，具有明确而高效的语法。Python具有良好的REPL（Read-Eval-Print Loop ，‘读取-求值-输出’循环），还可以通过dir()和文档字符串从REPL中开发新模块。这是程序员更偏向于Python而不是C、C++或Java的一个原因。

Python社区于90年代中期投入精力开发了Numeric，它是“Python的一个扩展，以使其像Matlab那样自然地支持数值分析”[1]。Numeric后来演变成为NumPy[2]。几年后，Matlab的绘图功能通过matplotlib库被移植到Python中[3]。科学计算的库围绕NumPy和matplotlib建立，并打包成SciPy包[4]，这在商业上由Enthought支持[5]。Python在类Matlab的数组操作和绘图功能上的支持，是它比Perl和Ruby更受到青睐的主要原因。

如今，对数据科学家来说，Python最流行的替代品是R、Matlab/Octave和Mathematica/Sage。除了前面提到的把Matlab的特性移植到Python的工作外，近期的工作已经把一些R和Mathematica中流行的特性移植到了Python。

R语言中的数据框和相关操作（来自plyr和reshape包）已经由pandas库实现[6]。scikit-learn项目[7]呈现了许多机器学习算法的通用接口，类似于R中的caret包。

Mathematica/Sage中“notebook”的概念已经由IPython notebooks实现。大数据技术学习交流群：805017805，不定期分享学习干货。

以我个人的观点，Python仍然在一些重要领域有所欠缺。

1. 首先是Python在数组操作和公式设定上的语法相对更加繁琐。Matlab/Octave在数组操作上的语法仍更受青睐（例如，这是它被斯坦福大学机器学习课程所采用的原因），而R语言在公式设定上的语法相当不错。

2. 再者就是静态图形库ggplot2与交互式图形库D3的对应Python库。matplotlib库既不易安装，又难以使用，还不容易建立用于web的交互式图形。

3. 第三就是NumPy和pandas库在处理大数据集时的可扩展性。Continuum公司正致力于解决这个问题，但距离创造出一些连贯又可用的东西还有很长的路要走。

4. 第四是缺乏一个类似于LINQ项目的、用于数据操作的嵌入式、声明式语言。Pandas作为一个低层次的数据操作工具箱来说很有用，但是跟踪复杂操作的专用Pandas语法会令人沮丧。

5. 最后是对数据科学家来说缺乏一个像R Studio一样高品质的IDE。

关注加米谷大数据获取更多大数据知识哦！

网友评论

大数据分析

本文标题：成都数据分析师培训，为什么数据科学家们选择了Python语言?

本文链接：https://www.haomeiwen.com/subject/cbyoxqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

成都数据分析师培训，为什么数据科学家们选择了Python语言?

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

大数据分析