![](https://img.haomeiwen.com/i10458593/ae9c07004e61267a.png)
![](https://img.haomeiwen.com/i10458593/1312037192edc74c.gif)
![](https://img.haomeiwen.com/i10458593/59d468982cd6568f.png)
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。
来源 | 量子位(id:QbitAI)
发自 | 凹非寺
厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,应该怎样才能入门?
这类的教程已经有很多。最近一位22岁的数据科学家Dario,以自学经历中用到的资源告诉你,如何从零开始学习数据科学。
所谓从零开始自学,是针对那些可以自主学习在线课程和阅读书籍,却没有上班之余接受课堂教育的人士。
在学习之前,如果你对线性代数、微积分、概率论与统计学、程序设计都不太熟悉,Dario建议先去学习一下这几门数学课程,然后再学习Python。
在学完以上内容后可以进入下面的学习。
01
看书还是看视频
如果想进入数据科学领域,每天一两个小时的学习是必不可少的,是看书还是选择看视频?
很多人都不想在每天工作8小时后还看书,因此视频教程是个不错的选择,而且可以在通勤路上观看。
Dario首先推荐的是Udemy的《数据科学与机器学习Python训练营》,这是他第一次接触数据科学的时候学习的课程。
课程中用Pandas和Numpy进行数据分析,并用Matplotlib和Seaborn进行一些数据可视化。虽然内容不多也不深入,但已经足够入门数据科学了。
Dario还推荐了Coursera上由吴恩达主讲的《机器学习》课程,学习时长大概十多个星期。课程以英文讲述,但是提供中文字幕。
这门课程的质量绝对有保障,大约12万名用户平均评分为4.9(满分5),人气也超高,共有260多万用户注册。
02
三本优秀的入门必看书
如果你更喜欢读书,Dario还推荐了3本入门数据科学的优秀教材。
第一本是《Python数据科学手册》,这本书从Jupyter Notebook入手,内容涵盖了Numpy、Pandas,、Matplotlib和Scikit-Learn等数据科学中最重要的部分。
该书的中文版去年已经出版,网上评分9.3,网友都说这是本优秀的入门级教材,非常适合非计算机专业的学生。
第二本是《统计学习导论》,它的内容会有点数学,但是也很容易阅读。
对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。
这本书的英文版提供免费下载(地址见文末),评分为9.5分,中文版8.3分。
第三本是《Scikit-Learn与TensorFlow机器学习实用指南》,这本书能帮助你深入了解机器学习的概念和算法。目前,该书的英文影印版和中文版都已经出版。
03
下一步
学完所有课程后,Dario建议初学者建立一个GitHub存档,并寻找5个数据集来练手,在这个过程中写出自己的结论和思考过程。
对于你未来要投递的公司来说,让他们看到你的工作很重要。因为你没有相关学位,因此需要以某种方式展示自己在数据科学中的工作,而GitHub是一个不错的选择。
![](https://img.haomeiwen.com/i10458593/d32fa7b9615c5c6c.png)
星标我,每天多一点智慧
![](https://img.haomeiwen.com/i10458593/4cb4622228156223.png)
网友评论