如果你想要在数据科学方向发展,避免这9个代价不菲的初学者错误,你能够免去数天,数周甚至数月的受挫。
如果您不小心,这些错误将会消耗您最宝贵的资源:您的时间,精力和动力。
我们将它们分为三类:
- 学习数据科学时的错误
- 申请工作时的错误
- 工作面试中的错误
何时学习数据科学
第一套错误是“卧底”,很难发现。他们慢慢地,但肯定会耗尽你的时间和精力,而不会给你警告,他们从这个领域的误解中产生。
1. 花费太多时间在理论上。
许多初学者陷入了花费太多时间在理论上的陷阱,无论是数学相关(线性代数,统计学等)还是机器学习相关的(算法,派生等)。
这种方法效率低下有三个主要原因:
- 首先,这是缓慢而艰巨的。如果你曾经感到所有学习的内容都非常费解,你可能已深陷陷阱。
- 第二,你也不会保留这些概念。数据科学是一个应用领域,巩固技能的最佳方法是通过实践。
- 最后,如果你不能看到你正在学习的东西如何和现实联系起来,那么会增加你变得消极想要放弃的风险。
这种重视理论的方法是学术界教授的传统论调,但大多数从业者更易从结果导向中受益。
为了避免这个错误:
- 平衡花费在研究与提供实践机会的项目的时间。
- 学会对部分知识不求甚解。随着进度,你自然会填补空白。
- 了解每件作品如何适应背景。
2.从头编写太多的算法。
下一个错误也会导致学生为了一棵树错过一片森林。在最初,你真的不需要从头开始编写每个算法。
虽然实现一些只是为了学习目的很好,但现实是算法正在成为商品。由于成熟的机器学习库和基于云的解决方案,大多数从业人员从来没有从头开始编码算法。
今天,了解如何在正确的设置(以正确的方式)应用正确的算法更为重要。
为了避免这个错误:
- 学习通用机器学习库,如Scikit-Learn(Python)或Caret(R) 。
- 如果你从头开始编写一个算法,这样做是为了学习而不是完善你的实现。
- 了解现代机器学习算法的优势及其优缺点。
3. 跳入深渊。
有些人进入这个领域是因为他们想要构建未来的技术:自驾车,高级机器人,计算机视觉等。这些技术由深度学习和自然语言处理等技术驱动。
但是,掌握基本原理很重要。正如每个奥运潜水员都需要先学习如何游泳,你也一样。
为了避免这个错误:
- 首先掌握“古典”机器学习的技术和算法,作为高级课题的基石。
- 知道古典机器学习仍然具有难以置信的未开发潜力。虽然算法已经成熟,但我们仍然处于挖掘如何利用它们的早期阶段。
- 学习系统的方法来解决任何形式的机器学习问题。
申请工作时
下一套错误可能会导致您在求职过程中错过一些很好的机会。即使你已经合格,你可以通过避免这些小错误来最大限度地发挥你的作用。
4.在简历中有太多的技术术语。
许多申请人在写简历时最大的错误是用太多技术术语。
相反,你的简历应该画一张照片,你的核心应该讲故事。您的简历应主张您对组织带来的影响,特别是如果您申请入门级职位。
为了避免这个错误:
- 不要简单地列出您使用的编程语言或库。描述你如何使用它们并解释结果。
- “少即是多……”仔细思考后强调最重要的技能,并通过消除其他不必要的内容。
- 制作简历主模板,以便您可以分离针对不同角色定制的不同版本。这保持每个版本干净。
5. 高估学位的价值。
有时,毕业生可以高估他们的教育价值。虽然在相关领域的强大程度肯定会提高您的机会,但它也不够充分,也不是通常最重要的因素。
很显然,我们不是说毕业生傲慢自大...
在大多数情况下,在学术环境中所教授的东西与企业中应用的机器学习过程截然不同。使用期限,客户和技术阻碍在学术界不那么迫切地需要根据实际权衡。
为了避免这个错误:
- 用使用现实世界数据的项目练习作为课程的补充。
- 系统学习解决机器学习问题的方法。
- 参加相关实习,即使是兼职。
- 在LinkedIn上接触当地的数据科学家进行咖啡聊天。
6. 搜索工作时太局限。
数据科学是一个相对较新的领域,组织仍在不断发展,以适应日益增长的数据影响。如果您只搜索“数据科学家”开头,那么您将会限制自己。
许多职位没有被标注为“数据科学”,但是它们将允许您以类似的角色发展类似的技能和功能。
为了避免这个错误:
- 通过所需技能 (机器学习,数据可视化,SQL等)进行搜索。
- 按工作职责搜索(预测建模,A / B测试,数据分析等)。
- 通过所用技术手段搜索(Python,R,Scikit-Learn,Keras等)。
- 根据职位扩展您的搜索(数据分析师,定量分析师,机器学习工程师等)。
面试期间
最后一套错误是面试过程中的绊脚石。你已经做了艰苦的工作来实现这一步,所以现在是时候做个好的结尾。
7.没有为面试时可能谈及的项目做准备。
有实际的项目经验是当遇到“如何做”类型面试问题时的应对保障。不仅仅只能在假设的说明应对方案,你还可以指出处理某些情况的具体例子。
此外,许多招聘经理会想要你有自给自足的能力,因为数据科学角色自然包括项目管理的要素。这意味着您应该了解整个数据科学工作流程,并了解如何将所有内容整理在一起。
为了避免这个错误:
- 从头到尾地完成一次项目,使您能够练习每一个重要步骤 (即数据清理,模型训练等)。
- 组织你的方法论。数据科学应该是深思熟虑的,而不是无计划的。
- 回顾和重新描述你过去在实习,工作或课程中曾做过的项目。
8.低估领域知识的价值。
技术技能和机器学习知识是获取数据科学职位的基本先决条件。但是,要真正脱颖而出,您应该了解更多关于您将应用您的技能的具体行业。
记住,数据科学从来不存在于真空中。
为了避免这个错误:
- 如果你正在面试一个银行的职位,请刷一些基本的财务概念。
- 如果您在《财富》杂志500周年期间面试一个重要位置,那么就可以进行一些案例访谈并了解盈利能力的驱动因素。
- 如果您正在为创业公司面试,了解其市场,并尝试了解如何获得竞争优势。
- 简而言之,在这里采取一点额外的举措可以带来很大的好处!
9.忽视沟通技巧
目前,在大多数组织中,与开发团队或分析师团队相比,数据科学团队仍然很小。因此,当入门级软件工程师一般被一名高级工程师指导时,数据科学家往往在更多的跨功能设置中工作。
面试官会需要你有能够与技术或数学背景的同事沟通的能力。
为了避免这个错误:
- 练习为非技术观众解释技术概念。例如,尝试向朋友解释你最喜欢的算法。
- 为常见的面试问题准备重点,并提供答案。
- 实践分析各种数据集,提取关键洞察力,并呈现您的发现。
结论
在本指南中,您学习了避免数据科学初学者9个最常见错误的实用技巧:
1.花费太多时间在理论上。
2.从头编写太多的算法。
3.直接跳入高级课程,例如深度学习,太快。
4.在简历中有太多的技术术语。
5.高估学位的价值。
6.搜索工作时太局限。
7.没有为面试时可能谈及的项目做准备.
8.低估领域知识的价值。
9.忽视沟通技巧。
翻译来源:elitedatascience | 2017 年 6 月 23 日
本文链接:https://elitedatascience.com/beginner-mistakes
网友评论