美文网首页大数据开发
大数据开发:Apache Ambari管理平台简介

大数据开发:Apache Ambari管理平台简介

作者: 成都加米谷大数据 | 来源:发表于2021-05-27 17:54 被阅读0次

    目前的大数据技术生态当中,分布式集群环境的管理,涉及到诸多细节,从安装配置到管理运维,不算是一项轻松的任务,这个时候就需要管理平台来提升工作效率。今天的大数据开发分享,我们来讲讲Apache Ambari管理平台。

    Apache Ambari是Hortonworks开源的Hadoop集群管理工具,并于2013年底从孵化器毕业,成为Apache的顶级项目。Ambari具备Hadoop组件的安装、管理、运维等基本功能,并提供GUI进行可视化的集群管理,简化了大数据平台的安装、使用难度。

    Apache Ambari概念介绍

    Server,Agent:Ambari框架采用的是Server/Client的模式,主要由两部分组成:ambari-agent和ambari-server。

    Ambari Server会读取Stack和Service的配置文件。当Ambari Server启动的时候,Ambari Server会分发Stack和Service的配置文件以及Service生命周期的控制脚本到Ambari Agent。Agent端拿到配置文件后,会下载安装公共源里软件包(对于centos系统,就是使用yum服务)。安装完成后,Ambari Server会通知Agent去启动Service。之后Ambari Server会定期发送命令到Agent检查Service的状态,Agent返回信息给Server,并呈现在Ambari的GUI上。

    一个ambari服务的目录结构大致如下:

    stacks:stack表示某个发行版本,例如HDP-2.0.6。stack版本可以通过metainfo.xml设置继承关系,便于共享脚本和配置。

    common-services:ambari的服务定义库。service在此完成定义,在某个stack版本注册,实现服务的发布。

    service:service是集群(大数据)组件的抽象,由一个或多个component组成。component的category有MASTER,SLAVE,CLIENT三种,对应不同的生命周期。

    Apache Ambari工作原理

    1.ambari已安装的服务配置会存储在mysql中,可通过web界面修改,改完记得重启服务保证配置生效;

    2.新添加的service定义会在ambari-server启动时,从server节点分发到各agent节点;

    3.安装service时,会默认yum安装,而且它对于安装服务,有30分钟的超时时间,如果30分钟内没有下载完,就会造成安装失败。这意味着大部分情况下需要你配置本地yum源;

    4.web界面的start,stop命令,会被server发送给agent,由agent调用生命周期脚本中的对应方法来实现服务起停。

    Ambari与Cloudera manager的对比

    除了Apache Ambari,Cloudera manager也是现在市场上活跃的管理系统之一。

    Ambari是Hortonworks贡献给Apache开源社区的顶级项目,它是一个基于web的工具,用于安装、配置、管理和监视Hadoop集群。

    Cloudera Manager是cloudera公司的一个产品,着重于帮助大家管理自己的cdh集群,通过Cloudera Manager统一的UI界面来快速地自动配置和部署cdh和其相关组件。

    总的来说:

    如果对服务集成或二次开发有需求的话,可以选择ambari。

    如果对集群稳定性要求高,服务集成相对弱的话,可以选择cloudera manager。

    关于大数据开发学习,Apache Ambari管理平台,以上就为大家做了基本的介绍了。Apache Ambari作为大数据管理平台组件来说,对于新手而言,只懂理论不行,是需要多加练习才能掌握的。

    相关文章

      网友评论

        本文标题:大数据开发:Apache Ambari管理平台简介

        本文链接:https://www.haomeiwen.com/subject/tzsdsltx.html