美文网首页
数据整合2018-12-26

数据整合2018-12-26

作者: 我以前是学渣 | 来源:发表于2019-01-15 16:56 被阅读0次


什么是数据整合?

数据整合就是把不同数据源的数据收集、整理、清洗、转换后加载都一个新的数据源,是为了给用户提供统一数据视图的解决方案。

首先它是一种过程,在这个过程中可能会发生合并、重构,数据结构一样的可以合并,不一样的则需要先将它变成一样的,然后再进行重构。


什么是数据集成?

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机(完整)的集中。

不同来源的数据如果是各个国家,那数据集成就是给这些国家中放一个联合国。


什么是数据共享?

数据共享是让不同地方使用不同计算机、不同软件的用户能读取他人分享的数据并进行操作。

数据共享简单的来讲,就是要将数据进行共享。它本就应该这么理解,你数据共享就是让人共同享用数据,至于会遇到什么问题?谁来解决?用什么方法解决?就不关数据共享的事了。

什么是空间数据?

空间数据又称为几何数据,它用来表示物体的位置、形态、大小分布等各方面信息,是对现实世界中存在的具有定位意义的事物和现象的定量描述。根据计算机系统中对于现实事物的存储组织、处理方法不同,以及空间数据本身的几何特征,空间数据又可分为图形数据图像数据

空间数据是随着时间变化了,而变化是有规律的。

空间数据实际上是更全面的定量描述信息。它能够描述一个人在哪(坐标信息)、属于哪个国家、哪个城市、此人的形状、颜色、体积、身高、生成日期、智商、能力指数等等等等。这个只是举个例子。其实像我们使用地图时,你的定位信息和周围的路段、建筑、商家信息都是从空间数据中取到的,国家有一个专门存储空间信息的仓库,并有一个对不同领域的空间数据进行管理的交换中心。

图形数据和图像数据的区别是,图形数据的显示是二维的,图像的显示是三维的。


什么是定量描述?

定量描述就是,你描述一个物体的内容可以用于计算。


什么是数据交换?

数据交换是为了实现数据共享的一种手段,手段实现是这样的,有一个管理者,它控制着所用部门数据的调用,a部分想使用b部门的数据,管理者就给他b部门的数据,b部门想使用a部门的数据,管理者就给他a部门的数据,不论是a还是b,在他们使用别人的数据的时候,同时也允许别人来访问自己的数据,这个就是交换行为,所以称为数据交换.

数据整合和数据集成有什么区别?

在我看来它们的目的是一样的,区别在于面向的对象不同,集成面向的对象是能够独立运行的,集成只需要建立数据交互的连接就行。而整合面向的对象可能不能够独立运行,但整合起来就能形成一套完整的系统。


什么是分布式?

分布式是计算机的一种算法,更是一种解决问题的思想,有一个故事就能很好的说明这个概念.古时候有人送给曹操一只大象,曹操想知道这只大象有多重,这就难住了在场所有大臣——上哪找这么大的称去?上哪找这么大的秤砣去?上哪找这么大的称杆去?这么大一只象谁能把它放在称上呀?在场有一个小家伙,名叫曹冲,它懂得分布式的思想,那就把没法计算的大目标,分成可计算的小目标,不能分大象,因为大象骨肉分开会死,于是他利用水的浮力找到了和大象一样重的石头,然后把石头分成很多份来称,最终将结果相加,就得到了大象的重量。这就是分布式思想,这个故事应该叫"首次分布式称重"。

相关文章

  • 数据整合2018-12-26

    什么是数据整合? 数据整合就是把不同数据源的数据收集、整理、清洗、转换后加载都一个新的数据源,是为了给用户提供统一...

  • springboot核心技术总结

    组件自动装配 web应用 Springboot应用 数据整合 容器整合 运维整合

  • 第四章 大数据的数据整合、交换与交易

    数据处理流程:数据源界定--数据的抽取和整合--数据分析--可视化--应用 数据整合过程要素:1.统一模式,制定标...

  • RSEM的TPM,FPKM,COUNT数据整合

    RSEM的数据整合只能整合count内容所以简单写了个函数整合RSEM的TPM,FPKM,COUNT

  • SSM整合 基础篇

    SSM整合 需求:通过SSM整合做出对前端基本查询的jsp响应 1 数据库数据 数据库数据如下 创建父工程ssm_...

  • 速写

    2018-12-25 2018-12-26

  • 是时候学一波python了

    基础语法,ide,环境整合,常用框架学习 1 week 后续主要方向 网络数据爬虫,数据整合获取 搭建python...

  • SpringBoot整合Hibernate

    2019年8月20日 SpringBoot整合Hibernate 基于springboot整合,基于MySQL数据...

  • 生信人的GEO-2

    整合多个GSE数据集挖掘肿瘤重要基因 都是关于肺癌的数据挖掘文章,而且是整合多个GSE数据集 组织病理上通常将肺癌...

  • Java企业常用开发技术

    1.springboot整合数据库连接池druid 2.springboot整合数据持久层框架mybatis my...

网友评论

      本文标题:数据整合2018-12-26

      本文链接:https://www.haomeiwen.com/subject/csmclqtx.html