在大数据的基础学习部分,分布式、微服务的名词,相信大家都听过。大数据处理的核心思想,说到底其实就是分而治之,将大数据处理任务分为小任务进行并行处理,这其中就离不开分布式微服务。今天的大数据入门分享,我们就来讲讲分布式微服务。
一、微服务核心思想
微服务的诞生,本质上来说,就是来自于分而治之的思想。传统时期的大而全的系统,当下来说已经很难满足市场需求,于是从单独架构发展到分布式架构,又从分布式架构发展到SOA架构,服务不断的被拆分和分解,粒度也越来越小,直到微服务架构的诞生。
微服务架构是一种架构模式,它提倡将单一应用程序划分成一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值。
每个服务运行在其独立的进程中,服务和服务间采用轻量级的通信机制互相沟通(通常是基于HTTP的RESTful API)。每个服务都围绕着具体业务进行构建,并且能够被独立地部署到生产环境、类生产环境等。
二、微服务架构与SOA架构的区别
微服务是真正的分布式的、去中心化的。把所有的“思考”逻辑包括路由、消息解析等放在服务内部,去掉一个大一统的ESB,服务间轻通信,是比SOA更彻底的拆分。
微服务架构强调的重点是业务系统需要彻底的组件化和服务化,原有的单个业务系统会拆分为多个可以独立开发,设计,运行和运维的小应用,这些小应用之间通过服务完成交互和集成。
三、微服务架构引发的问题
随着整个业务数据被分散在各个子服务之后,也带来了两个最明显的问题:
业务管理系统对数据完整性查询,比如分页查询、多条件查询等,数据被割裂后如何来整合;
数据分析挖掘,这些需求可能需要分析全量的数据,并且在分析时不能影响到当前业务。
从技术方案来讲,通常有两种选择来处理这些问题,第一种是在线处理数据,第二种是离线处理数据。
在线处理数据的方案:通过微服务提供的接口来获取数据,然后进行数据整合,不过这种方式有着明显的弊端,就是调用者需要编写大量的代码进行数据处理。其次在对各个微服务进行调取数据时会影响微服务的正常业务处理性能。
离线处理数据方案:将业务数据准实时的同步到另外一个数据库中,在同步的过程中进行数据整合处理,以满足业务方对数据的需求,数据同步过来后,再提供另外一个服务接口专业负责对外输出数据信息,这种方案有两个特点:
①数据同步方案是关键,技术选型有很多,如何选择切合公司业务的技术方案;
②离线数据处理对微服务正常业务处理没有影响。
目前来说,行业中比较主流的方案,是利用Spring Boot和MongoDB来解决,通过技术手段将分裂到N个微服务的数据同步到MongoDB集群中,在同步的过程中进行数据清洗,来满足公司的各项业务需求。
关于大数据入门,分布式微服务体系简介,以上就为大家做了简单的介绍了。在大数据时代背景下,分布式微服务的思想,是需要去深入理解的,这对于后续的大数据技术生态圈的学习,很有好处。
网友评论