美文网首页大数据 爬虫Python AI SqlPython小哥哥
Python 数据分析与挖掘的学习路径!

Python 数据分析与挖掘的学习路径!

作者: 14e61d025165 | 来源:发表于2019-04-30 14:44 被阅读0次

    0.前言

    很多人反映在学习了Python基础之后无所适从,不知道下一步往哪走。作为较早期的跨界者(土木狗)深有体会。本文将结合上图,为后来者指明方向,可作为参考。

    在此强调:如果打算依靠Python逃离现有的工作(如土木施工),那就要认真想想自己打算做哪一方面的工作,互联网营销、前端、运维、爬虫、数据分析、数据挖掘、Web开发?强烈建议:直接上拉钩或者Boss直聘,针对性学习更为稳妥。如果打算业余玩玩,那跟着我们一起业余吧,嚯嚯~

    <tt-image data-tteditor-tag="tteditorTag" contenteditable="false" class="syl1556606651528" data-render-status="finished" data-syl-blot="image" style="box-sizing: border-box; cursor: text; color: rgb(34, 34, 34); font-family: "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei", "WenQuanYi Micro Hei", "Helvetica Neue", Arial, sans-serif; font-size: 16px; font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: left; text-indent: 0px; text-transform: none; white-space: pre-wrap; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; background-color: rgb(255, 255, 255); text-decoration-style: initial; text-decoration-color: initial; display: block;"> image

    <input class="pgc-img-caption-ipt" placeholder="图片描述(最多50字)" value="" style="box-sizing: border-box; outline: 0px; color: rgb(102, 102, 102); position: absolute; left: 187.5px; transform: translateX(-50%); padding: 6px 7px; max-width: 100%; width: 375px; text-align: center; cursor: text; font-size: 12px; line-height: 1.5; background-color: rgb(255, 255, 255); background-image: none; border: 0px solid rgb(217, 217, 217); border-radius: 4px; transition: all 0.2s cubic-bezier(0.645, 0.045, 0.355, 1) 0s;"></tt-image>

    Python学习交流群:1004391443,有大牛答疑,有资源共享!有想学习python编程的,想提升自己能力的,欢迎加入讨论学习。

    . 在入门学习大数据的过程当中有遇见学习,行业,缺乏系统学习路线,系统学习规划,欢迎你加入我的大数据学习交流裙:529867072 ,裙文件有我这几年整理的大数据学习手册,开发工具,PDF文档书籍,你可以自行下载。

    1.目标确定

    凡事预则立,不预则废。事先明确自己要处理事情,大体上有个方向。比如你准备分析当地房价,或是电商某种类数据,或是某个垂直领域的数据等。

    2.数据获取

    爬虫是Python初学者的必经之路,通过爬虫既可以获取数据,还可以理解Web的工作原理。前者可以作为数据分析的原料,后者可以作为数据Web可视化的基础。至于你使用Request,还是Scrapy,或是Selenium,可以随意一点,这不是公众号【调包】的重点,度娘或GitHub有很多范例供大家参考。

    3.数据分析

    《利用Python进行数据分析》该书详细讲述了Pandas的使用,用它可以实现上图流程之后的底层流程(数据整理、描述分析、洞察结论、报告撰写),这个路径可以称之“数据分析”。

    4.数据挖掘

    上图数据整理之后的上层路径(建模分析、模型测试、迭代优化、模型加载、报告撰写),这个路径可以称之“数据挖掘”。将会用到Sklearn、XGboost、Pytorch、TensorFlow、Spark、Hadoop等库或工具。

    5.报告撰写

    不管是数据分析还是数据挖掘,最终都要反映到报告中,可以在线动态展示数据、也可以是离线静态报表,或者插入PPT。这个阶段Matplotlib是基础,至于用其他可视化库或是非Python系的工具,可以随意点,重点在于你分析的结论能否让阅读者肯定。

    6.需求反馈

    从报告撰写再回到目标确定,这是一个产品迭代的闭环。类似于土木施工组织管理的PDCA。

    相关文章

      网友评论

        本文标题:Python 数据分析与挖掘的学习路径!

        本文链接:https://www.haomeiwen.com/subject/xuhvnqtx.html