美文网首页
01_从EarthCube看地球科学研究的系统观

01_从EarthCube看地球科学研究的系统观

作者: 地学小哥 | 来源:发表于2020-03-05 10:16 被阅读0次

    内容摘要:大数据时代,不聊点这方面的科学计划总觉得缺点什么。今天我们说个不算太新的EarthCube计划,它是美国NSF的一个长期科学计划。在科学领域,越来越多的科学家,因为沉重的大数据计算负担,科研进展缓慢,很难实现他们预期的科研目标。特别是容易的事情都干得差不多了,剩下都是硬骨头,没点科技加持是玩不转的。

    1、EarthCube是什么

    大数据这个词听着时髦,做起来真是力气活,面对昂贵的大数据管理费用和缓慢的大数据运算速度,没点承受能力八成会把你搞抑郁。EarthCube计划(我们就叫地球立方体吧)就是想通过资助一大批科研项目,搞点具有跨学科价值的尖端数据科学技术出来,这样就可以大大提高科学家们的科研效率,帮助他们实现心中远大的科研目标。

    作为对美国政府提出的“大数据研发计划”的响应,NSF 启动了“EarthCube”( “地球立方体”)项目。英文原话是:EarthCube is a community-led cyberinfrastructure initiative for the geosciences.

    这个项目2011年就开始讨论了,计划是到2022年,搞出一批可解决大数据科学基础平台级的新技术。

    “地球立方体”项目提出的初衷是寻求“以整体视角审视地球系统的创造并管理地球科学知识的综合框架”,其主要意图是:

    • ①加速知识的融汇过程;

    • ②制定一个面向空前复杂系统的可测度体系;

    • ③充分整合和利用新技术。

    EarthCube项目的最终目的是以一种公开、透明和综合性的方式整合所有地球科学数据、信息、知识及实践来创建地球科学知识管理系统和基础设施,从而极大地提升研究及教育者的知识创造和传播能力。

    当数据越来越多,科学研究的模式也在不断地发生变化,在下面四个维度的新特征值得深入思考:

    • 规模:随着我们全面进入大数据时代,云提供了大规模存储和计算的强大组合。每个人都可以访问它,因此除了计算工作负载之外,我们还可以扩展访问范围。

    • 社区中心:我们发现,像云上的JupyterHub一样简单的工具是将研究人员和开发人员社区聚集在一起的强大工具。

    • 可重现性:众所周知,科学工作流程通常很难复制,尤其是在没有共享基础架构的情况下。云提供了共享基础架构的机会,这是可重复性追求的重要第一步。

    • 可扩展性:共享您的工作并让其他人在您离开的地方继续工作的能力对于科学事业至关重要。通过在云上共享数据集和基础架构,我们可以更轻松地扩展计算科学研究。

    从这几年EarthCube资助的项目上不难发现,地学领域的开源软件越来越多,而这些开源软件在未来也将大大促进 “EarthCube” 项目在数据科学方面的发展。

    2、Pangeo项目

    Pangeo是EarthCube资助的项目之一。其发展理念是利用python生态系统为科学研究服务,也鼓励用户和科学家们共同努力,更新和进化这套生态系统。典型的社区驱动型(community-drived)项目。

    Pangeo是一款具有开放性、实用性、可重复性、可继承性、可扩展性的科学服务平台。为了使科学研究和编写程序变得更加简单,该平台为用户提供了文档存储与读取、软件开发与维护、计算基础设施部署与构建的服务。Pangeo软件生态系统包括一系列开源工具,包括xarray、iris、dask、jupyter等软件包。

    Pangeo给自己定的任务是培育一个生态系统,在这个生态系统中,开发、发布、和维护新一代应用于海洋、大气、和气候科学的开源科学分析工具。这些分析工具将具备良好的可扩展性和适应性,以便满足当前以及未来的大数据处理的要求。 在这些工具的开发和维护过程中,还会引入地球科学之外的其它专业领域的先进理念、经验、和专业技术知识。

    Pangeo 是一款用于促进科研人员、软件、和计算基础设施协同工作的服务平台,而不是一款单独的软件包。

    Pangeo是一款由众人协同合作,开发软件、构建计算基础设施,以支持地球科学大数据研究的科学服务平台。

    这个平台上的产品包括:一些互相关联的软件工具包和这些软件包在云和高性能计算环境中的部署,这种部署可以称为Pangeo环境

    Pangeo平台上开源软件开发流程:在平台提供服务的领域,科学家们会根据行业特点规划其相关领域软件模块的工作流程,同时,与计算机专业的科学家合作,一起去编写、示范、测试、和优化相关开源软件。之后,将优化好的软件上传到共享平台上,供用户使用、根据需求进一步优化、和长期维护。

    结语:无论你是否Care,大数据时代已经到来。如何帮助地球科学研究过渡到大数据时代是我们每一位科研人员面临的共同问题!回想2018年我们在地震科学领域,开始的“地震会商技术系统”设计和研发,其实不也是上述理念的践行者吗?

    相关文章

      网友评论

          本文标题:01_从EarthCube看地球科学研究的系统观

          本文链接:https://www.haomeiwen.com/subject/lbktrhtx.html