美文网首页大数据 爬虫Python AI Sql程序员
看完这篇文章,再决定要不要当数据科学家?

看完这篇文章,再决定要不要当数据科学家?

作者: bd8941f5f5cc | 来源:发表于2019-01-07 22:12 被阅读2次

    如今,手把手教你当数据科学家的文章不在少数。

    “很简单!你是应届毕业生吗?你要......换工作?那上至编码、统计、机器学习,下至打造品牌故事、数据库和大数据,这些关键能力都要掌握,你需要资源?那去看看吴恩达在Coursera 上的机器学习课程......”

    确实,当你下定决心从事数据科学领域工作,这些都需要考虑。不过在这之前,你们应该问自己一个问题,并且这个问题是每个有抱负的数据科学家需要认真想一想的:“我要不要当数据科学家?”

    这个问题更关注你选择这一职业的原因,而非从事这一职业的方法。那么,吸引你选择这一领域,让你在未来几年都对其保持热情的原因是什么?

    为了回答这个问题,需要了解数据科学的缘起和未来走向。只有经过充分了解,你才能确定这个领域对你是否有价值。

    缘起

    在计算机科学、数据技术、可视化、数学和统计学融合为今日我们所称的数据科学之前,这些领域互不相干,各自为开发工具和产品奠定了基础,例如:Oculus 、Google Home、亚马逊Alexa、自动驾驶汽车、推荐引擎等。

    这些基础理论已经有了几十年的历史...... 追溯到19世纪前期,不同领域的科学家携手开发第一台计算机,研究微积分、概率论和算法,例如:CNN(卷积神经网络)、强化学习,最小平方回归等。随着数据和计算能力的激增,我们能够重构十年前的这些理论,并将其应用于解决现实问题。

    2009年和2012年,麦肯锡和《哈佛商业评论》发表了文章吹捧数据科学家,展示了他们如何颠覆企业运营方式,以及他们对未来商业的成功至关重要。他们不仅看到数据驱动的优势,而且还看到了未来预测分析对于保持竞争力和市场联系的重要性。大约在2011年的同一时间,Andrew Ng推出了一个关于机器学习的免费在线课程,AI FOMO(错失恐惧症)随之而来。

    现状

    公司开始搜寻高技术人才,来帮助他们搜集、存储、可视化,并理解所有数据。 “高薪高位急聘技术人才!”这些公司对自己寻找的人才知之甚少,因此涌现了大量岗位需求。

    今天如果你在ZipRecuiter上搜索,会发现和数据科学相关的空缺职位超过了十九万。每个人都在寻找自己的数据独角兽。为了吸引人才进入市场,数据科学家的定义很快就会被扩大,因为不同的公司和个人会对其有不同的定义。

    另一方面,对于应聘者来说前景一片大好:薪水可观、需求旺盛,而且公司承诺福利和头衔。人人趋之若鹜,急不可待地开发所有需要的技能,目标是竞争这个 “21世纪最具吸引力的工作”。

    我们有供也有求,那么问题是什么?刺激需求利用其炒作的不在少数。好像每天都有新课程来满足那些雄心勃勃的数据科学家,例如硕士课程,新手入门、在线课程等等。这仿佛一场军备竞赛,大家争相报名,上对了课,就能找到机器学习相关工作。 “没有博士学位?没问题。你只需要三到六个月的时间,给自己一笔一万到一万五的小额投资,毕业后即可得到一份高薪工作!” 

    这些课程旨在提供一站式服务:无论编程、可视化还是建模,应有尽有。你很快就会发现,许多问题都可以使用类似的方法解决(但并非所有),因此如果你正在找某种算法,那么肯定有一个现存的数据库能帮助你解决问题,很简单,对吧?

    且慢...

    如果你一直在关注数据科学,你肯定会发现一些重要现象:

    1.公司在开始收集正确的数据之前就会雇佣数据科学家(他们现在面临人工智能的冷启动问题),这意味着你需要参与数据流水线的每一步。包括数据收集、存储和可视化,然后才能进行建模。

    2.如果你急于获得数据科学的工作(采取了上述方法之一),便得和成千上万的人竞争。你要假设他们和你有类似的经验和项目经历。为了让自己脱颖而出,你需要展示自己的创造力和坚韧不拔的毅力。

    3.自己开发算法不太可能。除非你时间充足,否则一般都会使用现有信誉比较好的库。与一群负责开发的博士竞争,并冒险将一些效果不佳的东西投入生产有何意义?如果是为了自己的特定用途,那便另当别论。

    未来

    相信未来会产生重要变化:

    首先,数据科学家的技能以及对企业的预期影响将会更加明确。其次,AI模型将会走向自动化。不信的话,谷歌AutoML和TPot等软件包已经表现出这一趋势。技术上最具挑战性、最吸引人的部分将自动化。正如他们所说:“不会机器学习?没问题!”

    未来的发展轨迹:

    1.数据工程师或数据分析师不会再被冠上 “真正的”数据科学家的头衔,享受不应得的薪酬,这可能会减少市场上数据科学家的数量。

    2.人类洞察力和监督将变得越来越重要。并不是说技术专业知识地位降低,而是将分析与业务联系起来,了解软件如何与人们交互(即数据科学的人性化方面),这些将会更加重要。

    3.最后,由于作业中的机器学习部分表现最稳定,因此它将最先实现自动化(我们已经看到了这一点)。这意味着,数据科学家工作的大部分将涉及统一散乱数据、准备建模和评估。

    因此,在回答 “要不要做数据科学家?的时候”,想象一下自己在未来这个热门行业里的表现:尽管挑战重重,你是否能在持续快速发展的领域中成长?你是否拥有很高的应变和适应能力?如果是,欢迎来到数据分析的世界!

    在这里小编给大家推荐一个软件开发学习圈

    大数据学习qq群458345782

    python学习qq群250933691

    每天有免费的学习资源分享给大家

    相关文章

      网友评论

        本文标题:看完这篇文章,再决定要不要当数据科学家?

        本文链接:https://www.haomeiwen.com/subject/ozzprqtx.html