目前,Hadoop作业调度器主要有三种, 分别是:FIFO,Capacity Schedule(容量调度器),Fair Schedule(公平调度器)。
Hadoop2.7.2默认的资源调度器是Capacity Scheduler。
具体设置详见:yarn-default.xml文件
<property>
<description>The class to use as the resource scheduler.</description>
<name>yarn.resourcemanager.scheduler.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>
-
先进先出调度器(FIFO),按照到达时间先到服务。
FIFO调度器.jpg -
Capacity Schedule(容量调度器)
容量调度器.jpg
- 支持多个队列,每个队列可配置一定的资源量,每个队列采用FIFO调度策略。
- 为了防止同一个用户的作业独占队列中的资源,该调度器会对同一用户提交的作业所占资源量进行限定。
- 首先,计算每个队列中正在运行任务数与其应该分得的计算资源之间的比值,选择一个比值最小的队列(最闲的队列)。
- 其次,按照作业的优先级和提交时间顺序,同时考虑用户资源限制和内存限制对队列内任务排序。
- 三个队列同时按照任务的先后顺序一次执行,比如,job11,job21和job31分别排在队列的最前面,先运行,也是并行运行。
-
Fair Schedule(公平调度器),按照缺额排序,缺额大的优先。
公平调度器.jpg
- 支持多队列多用户,每个队列中的资源可以配置,同一队列中的作业公平共享队列中所有的资源,比如有三个队列,每个队列中的job按照优先级分配资源,优先级越高分配的资源越多,但是每个job都会分配到资源以确保公平。
- 在资源有限的情况下,每个job理想情况下获得的计算资源与实际获得的计算资源存在一种差距,这个差距就叫做缺额。
- 在同一个队列中,job的资源缺额越大,越先获得资源优先执行。作业是按照缺额的高低来先后执行的,而且可以看上图有多个作业同时运行。
网友评论