美文网首页小白的数据分析进阶之路大数据@IT·互联网
一本书,两个网站,边学边用入门Python

一本书,两个网站,边学边用入门Python

作者: 多么少 | 来源:发表于2017-11-28 02:15 被阅读411次
    图片来自Google

    Python已经妥妥成为数据挖掘和机器学习的必备工具,但是国内的计算机,数据科学专业并没有开设相关的Python课程,通过自学Python,以及用Python进行数据分析实战,是每个数据分析师的必经之路。

    想要借助Python进行数据分析,自然少不了学习《利用Python进行数据分析》这一经典入门书籍。

    以下是我借助这本书入门Python的经验:

    1.安装Python2.7最新版:

    虽然书里一再提到,要找到指定的EPDFree安装包,再安装Pandas,这样做会使得后续库的安装更方便,以及操作结果对原书的精确复制。但是!不得不说原书对应的Python版本太古老了!首先,在网上找相应版本实在是太麻烦,找到接近的版本,安装Jupyter Notebook(IPython Notebook的更名)会遇到各种麻烦,需要翻阅大量的技术博客来解决。博主在这方面有很多血泪的教训。

    怎么跳过麻烦的安装环节,顺利过渡到编程学习呢?有个一步到位的方法:安装Anaconda2 Python2.7版本。虽然Python2.7版本渐渐要被Pandas等数据库放弃了,但现在市面上主流的Python工具书都是以2.7作为蓝本,用2.7入门,可以解决我们不少代码转换的麻烦。等到熟练Python以后,再转3.6版本也不会是什么难题。

    首先Anaconda2集合了数据科学领域的库,且自带Spyder和Jupyter Notebook,几乎是买一送三大礼包。Jupyter Notebook可以方便地在网页端进行分析,并方便地嵌入图表,实在是极佳的Python Notebook开发环境。

    Jupyter Notebook网页开发环境

    其次,对原书部分代码不能精确复制相应结果,或者干脆报错的问题,首先,Python会在结果做相应提醒。此外,从原书报错的旧代码入手,去学习新代码,不失为一种更好的学习模式,总要比干巴巴把所有代码敲一遍,结果复现一遍要好得多。

    附本书的数据下载地:https://pan.baidu.com/s/1c2Mxhg0 密码: kyg1

    如果你想改变Jupyter Notebook一开始的安装路径,请参考:ipython notebook 如何修改一开始打开的文件夹路径?

    2.迅速把书末的“Python语言精要”过一遍

    让自己的行为和结果之间建立及时的、高质量的反馈来提升效能。

    这是艾利克森在《刻意练习》这本书里提到的学习精要。编程学习的及时反馈非常易得,在你执行Run的不久之后,就能在日志中给你一个及时反馈结果,当然,这个反馈可能是输出结果,也可能是长长的Error。

    学习过程中,正面和负面的反馈都是必要的。怎么获得高质量的反馈呢?

    从既往学习SAS 和R的经历,我非常推崇在学习编程的开始就进行实战演练,然后将自己的做法与其他高手进行对比,找到差距。

    当然,不是无脑地一头钻进去,而是找到一个具体的数据集,从数据集出发,可以思考有什么具体方法开始开展分析,再去学习相应的章节。或者,从书的章节脉络出发,仿制章节的分析方法,看可以得到怎样的分析结果(此时分析方法的合理性并不太重要)。

    所以,这个实战的战线可能会放得很长,但这种方法确保你学到的一手代码可以马上付诸实践,并由实践自发改良代码。

    一切的开始只需要你迅速过一下书末的《Python语言精要》,不求熟练,只要在脑海里存下索引的地图就好。

    3.两个Python(数据科学)学习网站:

    科赛:Connect People with Data

    Jupyter Notebook / R Studio 网页分析环境 + 数据集 + 在线比赛

    你用惯Jupyter Notebook以后,一定会想,如果在任一一台电脑上都可以登录服务器进行分析操作就好了,对吧?你想过,如果能方便地找到各个行业的数据集,直接进行分析操作就好了,对吧?你甚至想过,如果能提供一个平台进行在线组队比赛,交流切磋的就更好了对吧?

    这些在科赛都有,而且还令人发指地好用!!!路都铺好了,真b学不会数据分析只能怨自己了。

    别人做的项目,可见源码和结果 数据集 平台提供的Data Train和企业提供的有奖比赛

    Kaggle : Your Home for Data Science

    Kaggle是全球最大的数据科学社群,不解释。

    后续我将继续记录,分享我进阶数据科学领域的体会。

    相关文章

      网友评论

        本文标题:一本书,两个网站,边学边用入门Python

        本文链接:https://www.haomeiwen.com/subject/ectrbxtx.html