无论你如何处理数据,在2018年,数据科学都将发挥巨大作用。虽然2018年已经过半,但如果你想成为一名数据科学家,现在依然是最好的时机。本文全面阐述了数据科学家在2018年应该考虑的最新趋势。
数据科学家已经成为以技术为导向的世界的中心,他们可以以此来帮助那些拥有出色专业知识和强大技术背景的人。
诚然,成为一名数据科学家并不容易,必须要有一套明确的、适应性强的技能才可以。他们必须能够处理大量复杂和非结构化的数据,才能获得有效的业务需要的结果。
作为一名数据科学家,不仅意味着是一名数据搜集者,还应该精通数据设计和与软件程序的结合,分析、可视化和验证假设。在这里,我们将讨论一些可能推动高需求的趋势,数据科学家应该在2018年多关注这些趋势。
1.维持技能组合
在定义“数据科学家”一词的确切含义时,仍然存在某种模糊性。但在2018年,定义数据科学家所需要的专业知识,将有助于选择工作效率高的职员,他们具备建立和测试假设的知识,理解假设在统计方面的意义,并能够对其进行建模。数据科学领域主要包括R和Python编程语言。
大多数数据科学家表示,他们主要使用R或Python语言。但这并不是一个非此即彼的硬性规定,因为数据科学家有可能同时使用这两种语言。就现代行业动态而言,R和Python语言是目前大家在工作中使用最熟练的工具,被认为是每个数据科学家都应该学习的编程语言。
根据Stack Overflow community的研究,R语言目前使用范围更广,而Python语言增长更快,预计到2019年,Python语言在可靠性、易用性和灵活性方面将超过其他编程语言。数据科学家还使用了其他一些流行的编码语言,包括MATLAB(19%)、SQL(40%)、Java(18%)和C/ C++(18%)。
毫无疑问,数据科学是一个巨大的新兴行业。尽管我们必须面对行业初期的艰难。但是,它也会给你带来丰厚的薪水、长期的福利和舒适的生活条件。记住这些趋势,你就能获得长期的成功。
2.商业智能技能
商业智能是一个新兴的领域,每个数据科学家都应该考虑学习一下。它要求你能够解释数据集,同时向任何组织的决策者,构建和演示你的可视化分析。这会提高工作的价值。
对于一个数据专家来说,应该具备良好的沟通技巧,能够从数据挖掘中获得自己的见解,确保工作的明确简洁。SQL和Tableau都有助于提高你的技能组合,并将帮助你更好地进行数据管理和可视化。
3.了解数字双胞胎
数字双胞胎(Digital twins)将软件分析、机器学习和人工智能与数据相结合,以生成类似真实实物的数字仿真模型。
它能不断地根据各种来源的数据升级自己,以描述实时状态和工作条件。它使用与其通信的多个传感器的数据,就像一个对机器和环境有深入了解的工程师。
在物联网方面,数字双胞胎技术前景光明,会在未来几年主导着人们的兴趣。企业利用精心设计和熟练的数字双胞胎技术,来改进决策过程。它们与现实世界的事物相关联,有助于企业更好地了解系统状态,增强可操作性,并能及时应对变化。
数字双胞胎方法不是一步到位的,它包含多个步骤,包括实施、累积、应用统计分析,以及对管理目标的有效响应,等等。综合利用数字双胞胎方法,已经证明了对数字营销人员、城市规划人员、工业规划者以及医疗专业人员大有益处。
4.开发机器学习方面的专业知识
在领英(LinkedIn)的新兴职位中,机器学习工程师排名第一,而数据科学家排名第二。5年前,机器学习工程师的工作机会较少,但现在的工作机会比前几年增加了10倍。
5.实现人工智能(AI)和物联网(IoT)的重要性
近年来,人工智能越来越受到重视,它的目标是:发展更先进的行为,能够与人以及周围环境进行良好的互动。为连接用户和工业系统的物联网等许多产品提供了更高的效率。
物联网终于得到了应有的认可。根据最近的报告,到2021年,物联网的规模有可能达到6万亿美元,因为现在使用的是响应式设备和更智能高效的网络,这些已经成为所有组织在竞争市场中取得一席之地的需要。如今,数据科学家应该关注这些新兴趋势。
在过去的一年中,大多数全球性组织利用来自连接设备的数据,扩展他们的业务流程,并确保数百万美元的收入。如今,企业更加注重数据的保密性;而另一方面,各组织都表现出了对创新的兴趣。
6.分析智能APP和分析的重要性
数据科学家应该知道,在几年内,几乎所有的程序和App都将与人工智能相结合,以提高其价值。其中一些App如果没有人工智能根本就无法工作。
人工智能已成为广泛的软件程序和服务市场(包括ERP-企业资源规划)的下一个主要战场。
对于那些服务者,应该敦促他们使用人工智能来增加产品的价值——提供满足高要求的分析、智能软件程序和复杂的用户体验。
7.了解云优先策略和基于云的平台
各种组织正在广泛使用这些方法来分析大量的数据。专家们帮助大多数云时代的应用程序以可忽略的硬件成本运行,而人工智能则是他们指定列表中最新的一项,比如从小型聊天机器人到基本的搜索思考者(essential search thinkers)。预计到2018年底,人工智能与系统集成的比例将接近75%。
预计到2020年底,三分之一的数据将被云覆盖。它将作为一个促进者,来帮助他们分析数据,并提高主管部门的工作效率。例如,在对数据进行灵活分析的问题上,施乐公司就实施了云优先战略,使呼叫中心的失败率降低了20%。
有很多组织转向非物理处理系统,因此减少了对数据中心的依赖。但是,他们在运作过程中也面临一些挑战。最大的缺点是客户无法享受数据的免费访问服务,因此降低了灵活性。
8.了解独特的数据设计
各行各业现在已经认识到在组织内各级决策过程中,使用分析数据的重要性。这是组织成长所必需的。
数据科学家应该能够以一种简单的方式理解和设计数据,并以一种经济有效的办法实现结果。这样的数据科学家将会在组织中处于较高的位置,这不仅可以传播数据,还可以帮助他们在整个组织中产生巨大的影响。
9.了解黑暗数据
数据科学家应该知道黑暗数据的重要性。它是通过不同的网络操作收集来的信息,收集这些信息是为了存储,而不是使用。
开始时,一些组织甚至没有意识到,他们的系统正在收集黑暗数据。随着时间的发展,一些组织已经认识到它们的重要性,这就催生出了一种具有洞察力的搜索工具。这有利于业主获得高性能的数据,并能为企业创收和降低成本。
10.数据安全权限将收紧
企业已经高度重视数据安全问题,防止他人通过任何未经授权的途径窃取其个人和客户的信息。企业对完美的网络安全系统的需求越来越急迫,而这只有通过人工智能才能实现。安全系统对所有跨国公司来说已经不可或缺,关乎保护其系统设计、未来战略和利益相关者数据。
这些公司正在研究数据访问权限,以便通过不断地开发最新技术来保持其市场地位。由于存在安全风险,客户现在需要拥有准确的数据访问权限才能访问其信息。预计到2030年,物联网将为全球GDP贡献15万亿美元,而2018年将是实现这一里程碑的第一个年份。
11.生成对抗网络(GAN)将更为主流
GAN是Ian Goodfellow等人从2014年开始使用的一种无监督学习的机器学习模型。GAN具有巨大的应用价值,在技术主流中占据一席之地。打个比方,GAN就相当于两个人;一个是专业的艺术模仿者,另一个是专业的艺术策展人(艺术展览策划者)。
模仿者的工作是把一件艺术品画得天衣无缝,能够以假乱真,而策展人的职责则是用自己的专业知识,发现仿品和真品之间的差异。这有点类似于GAN的工作,该网络具有生成性和鉴别性。
生成性设计产生自然数据样本,而鉴别性设计的目的是区分实际数据和伪造数据。每当生成性设计愚弄了鉴别性设计,鉴别性设计就从中学习。这些网络非常具有挑战性,因为它们需要在使用前对大量数据进行适当的训练。另一方面,生成性设计获得的参数,比训练目标所需的参数要少。
我们经常需要它们的原因就在于其高效率。但GAN也有一些缺点,比如数据崩溃,可能无法连续学习。当他们的网络变得过于强大时,可能会与其他一些相邻的竞争网络发生冲突。不过,目前正在进行研究以克服这些困难。
12.实时系统的创新将加速
现在,世界正在向更多的创新和更先进的技术方向发展。在过去的几年里,广泛的机器学习正受到人们的关注。我们可以通过杰弗里·辛顿(Geoffrey Hinton)的胶囊网络的来了解创新和先进技术的重要性。这是一种神经网络设计,它能够在未来一年内激发出一些令人着迷的研究。
尽管有了新的发展和研究,但事实仍然是,数据科学家正在努力将这些先进的技术和创新应用于现实生活。不过这种状况预计在2018年底将会改变,因为这些实际应用方面的创新,已经覆盖了当前理论实践的研究。
因此,所有创新成功的机会更少了。但是还有一些这样的创新例子,这些创新还没有带来多大的成功。例如:销售机器人,它们本质上是重要的,并且能够帮助企业和客户的交易。这些应用程序都将在机器学习和商品化框架下工作,这些框架对真正的与人进行面对面的交谈是很有帮助的,并且将被证明是非常有效的。
类似的,还有其他优秀的应用程序,比如全球图书馆,将为人们的现实生活带来便利和更多的创新。
原文链接:
https://www.codementor.io/dyako/what-data-scientists-should-focus-on-in-2018-kvslzog1m
来源:Code Mentor
作者:David Yakobovitch
智能观 编译
—完—
亲爱的朋友:
想起那句话:我们不仅要低头赶路,还要抬头看天。
2018年已然过半,你的上半年过得好吗?
希望本文中的内容对你有所帮助,也期待你留言,跟我聊聊,你眼中值得关注的事。
夏安!
智能观 一米
2018-7-5 于北京中关村
想知道AI加教育领域有哪些最新研究成果?
想要AI领域更多的干货?
想了解更多专家的“智能观”?
请前往:www.智能观.com。
声明:
编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。
网友评论