美文网首页
3.NioEventLoop的启动和执行

3.NioEventLoop的启动和执行

作者: 朵巴阁 | 来源:发表于2019-11-27 20:54 被阅读0次

    NioEventLoop启动和执行

    NioEventLoop启动

    在服务端启动的代码中,我们看到netty在注册和绑定时,判断了当前线程是否是NioEventLoop线程。如果不是,
    则将这些操作包装成一个任务丢到EventExecutor中来完成。

    // 调用SingleThreadEventExecutor对象的execute方法
    eventLoop.execute(() -> register0(promise));
    
    // SingleThreadEventExecutor对象的execute方法
    @Override
    public void execute(Runnable task) {
        boolean inEventLoop = inEventLoop();
        addTask(task);
        if (!inEventLoop) {
            startThread();
        }
    
        if (!addTaskWakesUp && wakesUpForTask(task)) {
            wakeup(inEventLoop);
        }
    }
    

    在execute方法中,再次判断是否是NioEventLoop线程,若不是则执行startThread方法。startThread方法通过CAS
    将线程的state修改为已启动,成功后进入doStartThread方法。这个方法包装了一个任务,交由在创建NioEventLoop
    时设置的Executor执行。默认情况下,它是ThreadPerTaskExecutor,也因此,它会启动一个新的线程执行任务。包装
    任务的主要逻辑有3个:

    1. 将当前线程与nioEventLoop绑定;
    2. 更新上次执行的时长为当前时间-上个任务启动时间;
    3. 执行NioEventLoop的run方法;
    private void doStartThread() {
        executor.execute(() -> {
            thread = Thread.currentThread();
            updateLastExecutionTime();
            SingleThreadEventExecutor.this.run();
        });
    }
    

    至此,NioEvnetLoop就启动了。

    NioEventLoop执行

    当NioEventLoop启动后,就开始执行SingleThreadEventExecutor的run方法。此方法是一个死循环,也可以分为3个步骤

    1. 轮询channel中就绪的IO事件
    2. 处理轮询出的IO事件
    3. 处理所有任务,也包括定时任务

    轮询事件

    整个轮询IO事件的流程如下

    switch (selectStrategy.calculateStrategy(selectNowSupplier, hasTasks())) {
        case SelectStrategy.CONTINUE:
            continue;
        case SelectStrategy.BUSY_WAIT:
        case SelectStrategy.SELECT:
            select(wakenUp.getAndSet(false));
            if (wakenUp.get()) {
                selector.wakeup();
            }
        default:
    }
    

    在循环的开始阶段,调用选择策略器选择select策略,默认策略下,先判断是否有任务,若没有任务,调用selectNow(),否则进入SelectStrategy.SELECT,也即调用select(wakeUp.getAndSet(false))。

    selectNow()方法

    int selectNow() throws IOException {
        try {
            return selector.selectNow();
        } finally {
            if (wakenUp.get()) {
                selector.wakeup();
            }
        }
    }
    

    nioEventLoop的selectNow方法会调用持有的Selector对象的selectNow方法。此方法轮询后,即使没有事件也会立即返回,而selector.select方法则会阻塞。
    finally操作保证当wakenUp字段为true时,调用一次selector.wakeup方法,此方法会使阻塞的select方法唤醒,若当前没有select阻塞,则下一次select会立即返回。

    select(boolean oldWakenUp)方法

    首先看到入参为wakeup.getAndSet(false)。wakeup的作用稍后分析,这里简单提一下它的作用是控制将阻塞的selector唤醒。
    详细代码如下

    private void select(boolean oldWakenUp) throws IOException {
    Selector selector = this.selector;
    int selectCnt = 0;
    // 步骤1
    long currentTimeNanos = System.nanoTime();
    long selectDeadLineNanos = currentTimeNanos + delayNanos(currentTimeNanos);
    long normalizedDeadlineNanos = selectDeadLineNanos - initialNanoTime();
    if (nextWakeupTime != normalizedDeadlineNanos) {
        nextWakeupTime = normalizedDeadlineNanos;
    }
    for (;;) {
        // 步骤2
        long timeoutMillis = (selectDeadLineNanos - currentTimeNanos + 500000L) / 1000000L;
        if (timeoutMillis <= 0) {
            if (selectCnt == 0) {
                selector.selectNow();
                selectCnt = 1;
            }
            break;
        }
        // 步骤3
        if (hasTasks() && wakenUp.compareAndSet(false, true)) {
            selector.selectNow();
            selectCnt = 1;
            break;
        }
        // 步骤4
        int selectedKeys = selector.select(timeoutMillis);
        selectCnt++;
        if (selectedKeys != 0 || oldWakenUp || wakenUp.get() || hasTasks() || hasScheduledTasks()) {
            break;
        }
    
        // 步骤5
        if (Thread.interrupted()) {
            selectCnt = 1;
            break;
        }
        // 步骤6
        long time = System.nanoTime();
        if (time - TimeUnit.MILLISECONDS.toNanos(timeoutMillis) >= currentTimeNanos) {
            selectCnt = 1;
        } else if (SELECTOR_AUTO_REBUILD_THRESHOLD > 0 &&
                selectCnt >= SELECTOR_AUTO_REBUILD_THRESHOLD) {
            selector = selectRebuildSelector(selectCnt);
            selectCnt = 1;
            break;
        }
        currentTimeNanos = time;
    }
    

    代码较长,可以分为6个步骤

    1. 步骤1计算了多种精确到纳秒级别的时间,⑴当前时间;⑵select阻塞截止时间,这里又会根据是否有定时任务来计算,若有到时间的定时任务,则取最近一个定时
      任务的截止时间,若没有定时任务或定时任务还没到时间,则取1秒后;⑶规整化截止时间与下次唤醒时间

    从步骤2开始,又进入一个死循环内:

    1. 四舍五入计算阻塞超时时间。若超时时间小于0且空轮询次数为0,执行一次selectNow后返回。
    2. 轮询前先判断有没有任务,若有任务,且wakeup由false设置为true了,则执行selectNow。否则会因为无法唤醒selector耽误这个任务的执行。执行完后,结束本次循环。
    3. 阻塞式select。阻塞结束后,发生下列条件之一时,结束本次循环:⑴轮询到了IO事件;⑵进入select(boolean wakeup)之前,参数oldWakeup为true,也即之前有过wakeup的动作;⑶当前需要唤醒,可能是用户主动调用wakeup方法唤醒的;⑷队列里有任务了,可能是外部线程添加的;⑸有定时任务到期了
    4. 若线程被打断,设置空轮询次数为1,结束此次循环
    5. 根据当前时间与进入方法时计算的时间判断阻塞式select是否超时,若time - TimeUnit.MILLISECONDS.toNanos(timeoutMillis) >= currentTimeNanos成立,则有time-currentTimeNanos>=timeoutMillis,说明这次select执行的时间不够,可能触发了空轮询,将空轮询次数为1,计算累计空轮询次数是否大于阈值(阈值SELECTOR_AUTO_REBUILD_THRESHOLD默认为512),当大于阈值时,重建selector,以规避JDK空轮询bug。反之,则进行了一次有效的select,将累计空轮询次数置为1,结束本次循环。
    规避空轮询bug

    其实netty规避空轮询bug的方式也很巧妙,就是通过新建selector,并将旧selector上的key和attchment复制过去

    private Selector selectRebuildSelector(int selectCnt) throws IOException {
        rebuildSelector();
        Selector selector = this.select
        // Select again to populate selectedKeys.
        selector.selectNow();
        return selector;
    }
    
    private void rebuildSelector0() {
        final Selector oldSelector = selector;
        final SelectorTuple newSelectorTuple
        newSelectorTuple = openSelector();
        // 将老selector的key和attchment传递给新selector
        for (SelectionKey key : oldSelector.keys()) {
            Object a = key.attachment();
            int interestOps = key.interestOps();
            key.cancel();
            SelectionKey newKey = key.channel().register(newSelectorTuple.unwrappedSelector, interestOps, a);
            if (a instanceof AbstractNioChannel) {
                // Update SelectionKey
                ((AbstractNioChannel) a).selectionKey = newKey;
            }
        selector = newSelectorTuple.selector;
        unwrappedSelector = newSelectorTuple.unwrappedSelector;
        // 关闭老selector
        oldSelector.close();
        }
    }
    
    

    代码足够详细,就不多加解释了

    select(wakeup.getAndSet(false))执行完后,还有这样几行代码①

    if (wakenUp.get()) {
        selector.wakeup();
    }
    

    之前提到wakeup的作用是控制将阻塞的selector唤醒。这里先详细说下。
    回顾上文,SingleThreadEventExecutor对象的execute方法有一个添加任务后调用wakeup的动作,nioEventLoop重写了wakeup方法如下

    protected void wakeup(boolean inEventLoop) {
    if (!inEventLoop && wakenUp.compareAndSet(false, true)) {
            selector.wakeup();
        }
    }
    

    这里进行了2个判断,!inEventLoop表明这是外部线程,selector.wakeup()使阻塞的select操作立即唤醒,以便及时处理此时添加的这个任务。
    这个方法让外部线程在加入任务时,能及时唤醒selector处理任务
    根据netty的解释,wakeup.compareAndSet(false, true)总是在selector.wakeup之前调用,以便在同时多个任务时减少selector.wakeup的性能消耗。

    代码①的注释进一步提到存在两种竞态条件使wakeup太早被设置为true。

    1. 如果Selector在wakeup.set(false)和selector.select(timeout)之间被唤醒。这里发生在步骤4之前。
    2. 如果Selector在selector.select()和if(wakeup.get())之间被唤醒。这里发生在步骤4之后。
      在第一种情况,接下来的一次selector.select(timeout)(注:称为select1)将立即唤醒。之后由于wakeup为true,wakeup.compareAndSet(false, true)将失败,从而导致无法调用selector.wakeup,
      假如这期间(从步骤4到下一次selector.select(timeout)(注:称为select2))加入一个任务,那么得等到下一次select超时,任务才能得到处理。
      所以查询完任务后,如果发现wakeup为true,再调用一次selector.wakup()。
      不过细心的读者会留意到,在步骤3的几个条件里,netty会调用hasTask查看任务队列是否有任务,且在进入select方法前,会把wakeup设置为false,所以wakenUp.compareAndSet(false, true)会成功,因此会调用selectNow,而不必等到select2超时才处理任务。
      第二种情况下,select2会立即返回,没有问题。
      那这段代码有何意义?
      实际上笔者个人认为这段代码属于遗留代码,理由是笔者在52im找到了netty3的代码,在netty3中的AbstractNioSelector类中,wakeup设置为false后,直接调用了selector.select(timeout)。在当时看来,这不失为一种解决方案。

    到了这里,NioEventLoop完成了启动,并查询出了selectionKey,下一步就是处理selectionKey。
    so····未完待续

    相关文章

      网友评论

          本文标题:3.NioEventLoop的启动和执行

          本文链接:https://www.haomeiwen.com/subject/kdpmwctx.html