数据科学家必备工具有哪些?
当数据科学家需要使用某些软件时,其中一部分我们已经在之前的章节中做过介绍,这些软件涵盖了数据科学家所需要的基础专业内容。实际的工作范畴可能会超越求职时候的工作描述,这也是IT工作的常态之一。这在某种程度上是好的,因为它提供了学习新技能的机会,而这也是数据科学领域最引人入胜的方面之一。
在这一章中,我们会探索数据科学环境中常用的软件。不是所有在这里提到的软件都会在你的工作中用到,但了解它们会让你拥有更多选择。特别是我们会提到Hadoop套件的一些其他备选工具(例如Spark、Storm等),许多功能强大的面向对象编程语言(Java、C++、C#、Ruby和Python),现有的数据分析软件(R、Matlab、SPSS、SAS或是Stata),你可能会用到的虚拟化程序以及大数据集成系统(例如IBM的BigInsights、Cloudera等)。我们还会看看你可能接触到的其他软件,例如GIT、Excel、Eclipse、Emcien以及Oracle。注意这个列表只是告诉你这一领域的主流软件有哪些,但它们并不一定是你在未来工作中的真实环境下所使用的工具。一些公司可能会用到它所在行业的专业软件,在你入职的时候也许会被要求你去熟悉这些软件。了解这个列表中的大部分软件会让你工作地相对轻松和明确。
Uber在大数据运用上的惊人表现
Uber是一款提供出租车预订服务的智能手机应用,为需要搭车的用户和想要载客的司机搭建了沟通渠道。这项服务引起了很大争议,一方面普通的出租车司机抱怨Uber毁掉了他们的生计,另一方面民众担心Uber的司机缺乏监管。
但这些争议并没能阻止Uber取得巨大的成功:2009年发布时仅覆盖旧金山一地,到了现在,除了南极洲之外,已覆盖所有大陆的许多主要城市。
这家公司深深地扎根于大数据,对数据的运用远比传统出租车公司要更高效,而这正是促使它成功的很大一部分原因。
谷歌想拿160万病人数据去学习“治病救人”
英国《卫报》近日的一份报道透露了谷歌在医疗健康领域的新动作:谷歌旗下的DeepMind与英国国家医疗服务系统NHS(National Health Service)信托机构达成协议,允许访问NHS旗下三家医院约160万病人的医疗记录。
这并非谷歌首次进军医疗健康领域。早在今年2月,就有消息披露DeepMind与NHS达成合作,将要推出两个APP协助医护人员。其中一个应用叫Streams,用来帮助医生监控急性肾衰竭病人的身体状况,以在紧急情况下加快诊断,跟死神抢时间;另一个叫Hark,这个应用早从2010开始就由伦敦帝国学院的团队开发出来,致力于帮助医生护士整理医疗信息,摆脱手写处方等杂乱无章的方式。
以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注Datartisan数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!
网友评论