美文网首页大数据学习大数据分析
成都大数据分析培训:Python有什么用?可以做什么?

成都大数据分析培训:Python有什么用?可以做什么?

作者: f46294cfe85d | 来源:发表于2018-08-03 11:25 被阅读2次

     很多人正在考虑学习Python,或者最近刚开始学习,可能会问自己:“我到底可以用Python做什么?”

    这是个棘手的问题,因为Python有很多用途。Python主要可用于一下三个方面:

    Web开发

    数据科学——包括机器学习、数据分析和数据可视化

    脚本编写

    Web开发

    像Django和Flask这样基于Python的Web框架最近在web开发中变得非常流行。这些web框架帮助您用Python创建服务器端代码(后端代码)。这些代码在您的服务器上而不是在用户设备以及浏览器上(前端代码)运行。如果您不熟悉后端代码和前端代码之间的区别,请参阅下面脚注。

    但是,等等,我为什么需要web框架呢?

          那是因为web框架让构建通用后端逻辑变得更简单了。这包括把不同的URL映射到Python代码块、处理数据库和生成用户在浏览器中看到的HTML文件。

    我应该用哪个Python web框架?

          DjangoFlask是两种最流行的Python web框架。如果您刚刚开始学习,那么可以用它们中的任何一个。

    Django和Flask有什么区别?

    Gareth Dwyer有篇关于这个话题的文章写得非常好,我在这里引用一下:

    主要的对比:

          Flask提供简洁、灵活和细粒度控制。它很是客观(让您决定如何实现想要的东西)。

    Django提供一种包罗万象的体验:可以获得管理面板、数据库接口、ORM(object-relational mappling,对象关系映射),还有开箱即用的应用程序和项目的目录结构。

    应该选择:

          Flask,如果专注于体验和学习机会,或者想对选用哪个组件有更大的控制权(例如想使用哪个数据库和如何与它们交互)。

          Django,如果你专注于最终的产品。特别是如果正在做一个简单的应用程序(如一个新闻网站、电子商店,或者博客)并且希望有一个直接明了的做法。

          换句话说,如果你是位初学者,Flask可能是个更好的选择,因为用到的组件比较少。如果想要更多的定制,那么Flask也是个更好的选择。

    而且,根据我的数据工程师朋友Jonathan T Ho 的看法,Flask更适合创建那些所谓的REST API的东西,因为它比Django更灵活。另一方面,如果您想构建一些简单的东西,Django会让您更快地达到目标。

    数据科学 —— 包括机器学习、数据分析和数据可视化

    首先,我们来回顾一下什么是机器学习。

    解释什么是机器学习的最好方法莫过于举个例子。假设你想开发一个程序用于自动检测图片中的内容。因此,对于下面的这张图片,你希望程序能识别出这是条狗。

    而对于下面的这张图,你希望程序能识别出它是张桌子。

    你也许会说,我可以用几行代码搞定。例如,如果在图片上有很多淡棕色的像素,那么我们可以说那是狗。或者,你可以找到在照片中检测边缘的方法。然后,你也许会说,如果有很多直边,那么那就是一张桌子。

          但是,这种方法很快就遇到麻烦了。如果图片上是条没有棕色毛发的白狗怎么办?如果图片上显示的只是桌子的圆形部分呢?

    轮到机器学习大显身手了。

    机器学习可实现一些算法,能自动检测给定输入中的模式。

    比如,给机器学习的算法提供1000张狗的照片和1000张桌子的照片。那么,它将会学习区别狗和桌子。当给出一张狗或桌子的新图片时,它将能够识别出是狗还是桌子。这和婴儿学习新事物有点类似。婴儿是如何知道一样东西看起来像狗,而另一样东西看起来像桌子呢?可能就是从大量的例子中学到的。

    你也许不会明确地告诉一个婴儿:“如果一样东西是毛茸茸的,并且有着淡棕色的毛发,那么它可能是条狗。”可能只会说:“那是条狗。这也是条狗。这是桌子。那也是桌子。”

         机器学习算法的工作方式大致相同。

          您可以把同样的想法应用于:

    推荐系统(像YouTube、Amazon和Netflix在用的)

    面部识别

    声音识别

    您可能听说过的流行的机器学习算法包括:

    神经网络

    深度学习

    支持向量机

    随机森林

    可以使用任何一个上述算法来解决我刚才解释过的图片标注问题。

    将Python用于机器学习

    有一些流行的Python机器学习库和框架,其中最流行的两个是scikit-learnTensorFlow。scikit-learn附带了一些更流行的内置机器学习算法。我刚才提到了其中的几个。TensorFlow更像是个低级库,它允许您构建自定义机器学习算法。

          如果您刚开始一个机器学习项目,那么我建议您先用scikit-learn。如果您开始遇到效率问题,那么我建议用TensorFlow。

    我应该如何学习机器学习呢?

    要学习机器学习基础知识的话,我建议选择斯坦福或加州理工学院的机器学习课程。请注意,您需要微积分和线性代数的基本知识以理解这些课程中的某些内容。然后,我会用Kaggle来练习从课程中学到的知识。Kaggle是个网站,大家在这个网站上比试谁能对一个给定的问题构建出最佳的机器学习算法。网站上也有给初学者用的好教程。

    那么数据分析和数据可视化呢?

    为了帮助您理解,我在这里给您举个简单的例子。假设,您为一家在线销售产品的公司工作。那么,作为数据分析师,您也许会画一个类似的条形图。

    条形图1-由Python生成

         从这张图上,我们可以看到,在某个特定的周日,对于某件产品来说,男性购买了400多件,而女性购买了大约350件。

    作为一个数据分析师,您也许会对其中的差异做出几个可能的解释。一个很显然的可能解释是,该产品在男性中比在女性中更流行。另一个可能的解释是,样本量太小,这个差异是偶尔产生的。还有一个可能的解释是,在周日,由于某种原因,男性比女性更倾向于购买该产品。

         为了搞明白哪个解释是正确的,您可能绘制另一张图,如下图所示:

    折线图1-由Python生成

    我们不再只显示周日的数据,而是整整一周的数据。正如所见,从这张图中,我们可以看到,这种差异在不同的日子里很一致。从这个简单的分析中,您可能得出了结论,对这种差异,一个最有说服力的解释就是,这个产品更受男性而不是女性欢迎。

    另一方面,如果您看到是如下所示的图呢?

    折线图2-同样由Python生成

         那么,如何解释出现在周日的差异呢?

    你也许会说,也许出于某种原因,男性在周日更倾向于购买该产品。或者,也许只是巧合,男性在周日购买了更多的该产品。好了,这是个简化的例子,展示了数据分析在真实世界中看起来的样子。

    我在谷歌和微软工作的时候做过数据分析,跟这个例子非常相似,只是更复杂一些罢了。事实上,我在谷歌工作时,是用Python来做这种分析,而我在微软的时候,用的是JavaScript。在这两家公司工作的时候,我用SQL从数据库中提取数据。然后,我会用Python和Matplotlib(在谷歌工作时)或JavaScrip和D3.js(在微软工作时)进行数据可视化和分析。

    用Python进行数据分析/可视化

    最流行的数据可视化库之一是Matplotlib。刚开始学习的话,它是个不错的库,因为:它容易上手。

          其他一些库,如seaborn是以它为基础的。因此,学习Matplotlib可以帮助您随后学习其他库。

    我应该如何学习用Python进行数据分析/可视化?

    首先,您应该学习数据分析和可视化的基础知识。我在网上没有找到相关的好资源。因此,最终,我在YouTube上做了相关的视频(用Python和Matplotlib进行数据分析/可视化的入门课程)。

          学习了数据分析和可视化基础知识之后,在Coursera和Khan Academy上学习统计的基础知识也是很有帮助的。

    脚本编写

    什么是脚本编写?

          通常,脚本编写是指编写小程序以让简单任务自动化。

    我在这里给您举个来自我个人经验的例子:我曾在日本的一家小型初创企业工作,我们有个电邮支持系统,用来回复客户通过电邮给我们提出的问题。我在那里工作的时候,我的任务是计算含有特定关键字的电邮数量,这样我们才可以分析我们收到的电邮。我们本来应该用人工统计,但是,我写了个简单的程序/简单的脚本来自动完成该任务。

          事实上,那时我们是用Ruby编写脚本,但是,对于这样的任务来说,Python也是个不错的语言选择。Python适合这种类型的任务主要是因为它有相对简单的语法并且容易编写。用它来写些小程序并进行测试花不了多少时间。

    那些嵌入式应用呢?

           对于嵌入式应用,我不在行,但是我知道Python可以配合Rasberry Pi工作。它在那些硬件发烧友中非常流行。

    那么游戏呢?

         可以用PyGame库来开发游戏,但是,它不是最流行的游戏引擎。如果把游戏作为兴趣爱好,您可以用它来构建项目,但是,如果您真的要做游戏开发,我个人不建议选择它。

          相反,我推荐您用Unity的C#脚本,它是最流行的游戏引擎之一。它允许您在很多平台上构建游戏,这些平台包括:Mac、Windows、iOS和安卓。

    那么,桌面应用呢?

    您可以用Python的Tkinter来开发,但是它似乎不是最流行的选择。相反,用Java、C#和C++等语言开发桌面应用看起来更流行。

    最近,一些公司也已经开始使用JavaScript来创建桌面应用程序了。比如,Slack的桌面应用程序是用Electron来构建的。它允许您用JavaScript来构建桌面应用。就我个人来说,如果我要构建一个桌面应用,我会用JavaScript。它允许您复用web版本的某些代码(如果有的话)。

    选Python 3还是Python 2?

          我会推荐Python 3,因为它更现代化,并且目前它更受欢迎。

    脚注:对于后端代码和前端代码的的说明(万一您对这些术语不熟悉)。

    假设,您想做个类似于Instagram的东西。那么,您需要为每种想支持的设备创建前端代码:

    Swift用于iOS设备

    Java用于安卓设备

    JavaScript用于web浏览器

    每组代码都将在对应类型的设备/浏览器上运行。这组代码将决定应用的布局看上去的样子,单击时按钮的外观等等。

          但是,您仍然需要存储用户信息和照片的能力。除了在用户的设备商储存这些信息,您还会希望将这些信息储存在服务器上,这样,每个用户的关注者就能看到用户的照片。

          这里就是后端代码/服务器端代码的用武之地了。您需要编写后端代码以执行以下操作:

    持续跟踪谁在关注谁

    压缩照片,以免占据太多存储空间

    在发现功能中给每个用户推荐照片和新账号

    好了,这就是后端代码和前段代码之间的区别。

    顺便说一下,Python不是编写后端/服务器端代码的唯一好选择。还有很多其他流行的选择,包括Node.js,它是基于JavaScript的。成都加米谷大数据分析培训,数据分析、数据挖掘、机器学习... 8月新课咨询报名中。英文原文:What exactly can you do with Python? Here are Python’s 3 main applications

    相关文章

      网友评论

        本文标题:成都大数据分析培训:Python有什么用?可以做什么?

        本文链接:https://www.haomeiwen.com/subject/radyvftx.html