[023]你真的懂AIDL的oneway嘛？

作者: 王小二的技术栈 | 来源:发表于2020-02-11 12:25 被阅读0次

IM 小项目总结
[023]你真的懂AIDL的oneway嘛？
AIDL oneway
AIDL oneway 方法的隐患
你真的懂嘛
你真的懂沟通嘛
你，真的懂孩子嘛
你真的懂富人思维嘛
Android 冷知识
我们真的懂小米嘛？

1 前言

用AIDL的人应该都知道下面代码中start和stop方法定义成oneway代表这个Binder接口是异步调用。

interface IPlayer {
    oneway void start();//异步，假设执行2秒
    oneway void stop();//异步，假设执行2秒
    int getVolume();// 同步，假设执行1秒
}

1.1 什么是异步调用？

举个例子：假如Client端调用IPlayer.start()，而且Server端的start需要执行2秒，由于定义的接口是异步的，Client端可以快速的执行IPlayer.start()，不会被Server端block住2秒。

1.2 什么是同步调用？

举个例子：假如Client端调用IPlayer. getVolume()，而且Server端的getVolume需要执行1秒，由于定义的接口是同步的，Client端在执行IPlayer. getVolume()的时候，会被Server端block住1秒。

1.3 为什么会有同步调用和异步调用？

细心的读者已经发现了，其实一般使用异步调用的时候，Client并不需要得到Server端的执行Binder服务的状态或者返回值，这时候使用异步调用，可以有效的提高Client执行的效率。

2 提问

好像很多人都明白前面讲的意思，我就出几个问题考考大家

假设进程A中有如下两个Binder服务IPlayer1和IPlayer2，这两个服务都有两个异步的接口start和stop。

interface IPlayer1 {
    oneway void start();//异步，执行2秒
    oneway void stop();//异步，执行2秒
}
interface IPlayer2 {
    oneway void start();//异步，执行2秒
    oneway void stop();//异步，执行2秒
}

2.1 问题1

如果进程B和进程C同一时刻分别调用IPlayer1.start()和IPlayer2.start()，请问进程A能否同时响应这两次Binder调用并执行？

正确答案：可以同时执行。

2.2 问题2

如果进程B和进程C同一时刻分别调用IPlayer1.start()和IPlayer1.start()，请问进程A能否同时响应这两次Binder调用并执行？

正确答案：不能同时执行，需要一个一个排队执行。

2.3 问题3

如果进程B和进程C同一时刻分别调用IPlayer1.start()和IPlayer1.end()，请问进程A能否同时响应这两次Binder调用并执行？

正确答案：不能同时执行，需要一个一个排队执行。

如果回答正确并且知道原因的朋友，这个文章就可以不看了。如果回答错误或者蒙对了不清楚原因的朋友，请继续阅读文章帮你理解这些问题。

3 代码分析

话不多说，先看源码，我们首先来看看oneway的Binder调用在Binder Driver中的逻辑

/**
 * binder_proc_transaction() - sends a transaction to a process and wakes it up
 * @t:      transaction to send
 * @proc:   process to send the transaction to
 * @thread: thread in @proc to send the transaction to (may be NULL)
 */
static bool binder_proc_transaction(struct binder_transaction *t,
                    struct binder_proc *proc,
                    struct binder_thread *thread)
{
    //找到Server端的对应Binder服务在Binder驱动中对应的对象binder_node
    struct binder_node *node = t->buffer->target_node;
    //判断这次Binder调用是不是oneway
    bool oneway = !!(t->flags & TF_ONE_WAY);
    //初始化为false，用于标记当前Server端的对应Binder服务是否正在执行oneway的方法
    bool pending_async = false;

    binder_node_lock(node);
    //oneway == true
    if (oneway) {
        if (node->has_async_transaction) {
            //第2次oneway调用执行这里
            //发现对应Binder服务正在执行oneway的方法，设置pending_async为true
            pending_async = true;
        } else {
            //第1次oneway调用执行这里
            //发现对应Binder服务没有执行oneway的方法，设置has_async_transaction为1
            node->has_async_transaction = 1;
        }
    }

    binder_inner_proc_lock(proc);

    //如果发现Server端已经死亡，就直接返回了，正常不会执行
    if (proc->is_dead || (thread && thread->is_dead)) {
        binder_inner_proc_unlock(proc);
        binder_node_unlock(node);
        return false;
    }

    //oneway的调用thread为空，第1次oneway调用，pending_async为false
    if (!thread && !pending_async)
        //第1次oneway调用会找到一个空闲的Server端线程，用于响应这次oneway调用
        thread = binder_select_thread_ilocked(proc);

    if (thread) {
        //第1次oneway调用,thread不为空，直接把这次Binder work放到thread的工作队列去执行
        binder_enqueue_thread_work_ilocked(thread, &t->work);
    } else if (!pending_async) {
        binder_enqueue_work_ilocked(&t->work, &proc->todo);
    } else {
        //第2次oneway调用,thread为空，pending_async为true，
        //这次Binder work放到Binder Node的async_todo队列中,不会立刻执行
        binder_enqueue_work_ilocked(&t->work, &node->async_todo);
    }

    if (!pending_async)
        //第1次oneway调用，thread不为空，所以需要唤醒thread执行工作队列中的Binder work
        binder_wakeup_thread_ilocked(proc, thread, !oneway /* sync */);

    binder_inner_proc_unlock(proc);
    binder_node_unlock(node);

    return true;
}

对应到我们的三个问题，我们首先有这样子的前提，进程A中有两个Binder Server端IPlayer1和IPlayer2，也就是在Binder驱动中有两个binder node的结构体，并且进程A的Binder线程池处于空闲的状态。还有一点要明确的是，就算进程B和进程C同时发起Binder调用，但是在Binder驱动中还是有先后顺序，因为有一把锁binder_inner_proc_lock(proc)。

问题1解析：

因为进程B和进程C分别调用两个Binder服务，也就是两个binder node，所以进程B和进程C都会走如下的代码，也就是说进程A会有两个线程分别处理进程B的IPlayer1.start()和进程C的IPlayer2.start()，所以答案是同时执行

static bool binder_proc_transaction(struct binder_transaction *t,
                    struct binder_proc *proc,
                    struct binder_thread *thread)
{
    struct binder_node *node = t->buffer->target_node;
    bool oneway = !!(t->flags & TF_ONE_WAY);
    bool pending_async = false;
    binder_node_lock(node);
    if (oneway) {
        //不管是是进程B还是进程C，因为不是同一个binder_node，所以都是走false的逻辑
        if (node->has_async_transaction) {
            //不执行
        } else {
            node->has_async_transaction = 1;
        }
    }
    binder_inner_proc_lock(proc);
    if (!thread && !pending_async)
        //oneway调用会找到一个空闲的Server端线程，用于响应这次oneway调用
        thread = binder_select_thread_ilocked(proc);

    if (thread) {
        //oneway调用,thread不为空，直接把这次Binder work放到thread的工作队列去执行
        binder_enqueue_thread_work_ilocked(thread, &t->work);
    } else if (!pending_async) {
        //不执行
    } else {
        //不执行
    }
    if (!pending_async)
        //oneway调用，thread不为空，所以需要唤醒thread执行工作队列中的Binder work
        binder_wakeup_thread_ilocked(proc, thread, !oneway /* sync */);

    binder_inner_proc_unlock(proc);
    binder_node_unlock(node);
    return true;
}

问题2解析：

我们假设先处理进程B的IPlayer1.start()的调用，进程B会执行和问题1中描述的代码一样的操作，唤醒进程A中的一个线程，处理这次进程B的IPlayer1.start()调用。

但是进程C的IPlayer1.start()调用逻辑就不一样了，应该是下面这个逻辑，也就是说进程A不会立刻处理进程C的IPlayer1.start()的调用。所以答案就是不能同时执行，需要一个一个排队执行。

static bool binder_proc_transaction(struct binder_transaction *t,
                    struct binder_proc *proc,
                    struct binder_thread *thread)
{
    struct binder_node *node = t->buffer->target_node;
    bool oneway = !!(t->flags & TF_ONE_WAY);
    bool pending_async = false;

    binder_node_lock(node);
    //oneway == true
    if (oneway) {
        if (node->has_async_transaction) {
            //因为是进程C和进程B是同一个binder_node，进程B已经将has_async_transaction设置true
            pending_async = true;
        } else {
           //不执行
        }
    }
    binder_inner_proc_lock(proc);
    if (thread) {
        //不执行
    } else if (!pending_async) {
        //不执行
    } else {
        //这次Binder work放到binder_node的async_todo队列中,不会立刻执行
        binder_enqueue_work_ilocked(&t->work, &node->async_todo);
    }
    binder_inner_proc_unlock(proc);
    binder_node_unlock(node);
    return true;
}

那什么时候处理进程C的IPlayer1.start()，看下面代码，简单说就是会在处理完进程B的IPlayer1.start()之后，在释放进程B调用IPlayer1.start()申请的buffer的时候，处理进程C的IPlayer1.start()。

        case BC_FREE_BUFFER: {
            //准确释放进程B申请的buffer
            if (buffer->async_transaction && buffer->target_node) {
                struct binder_node *buf_node;
                struct binder_work *w;
                //先拿到这块buffer处理的binder node，也就是IPlayer1对应的binder node
                buf_node = buffer->target_node;
                binder_node_inner_lock(buf_node);
                //检查一下buf_node是否有未处理的oneway的binder work
                w = binder_dequeue_work_head_ilocked(
                        &buf_node->async_todo);
                if (!w) {
                    //不执行
                    buf_node->has_async_transaction = 0;
                } else {
                    //如果有未处理完的oneway的binder work，就将binder node保存的async_todo全部添加到进程A的todo。
                    binder_enqueue_work_ilocked(
                            w, &proc->todo);
                    //唤醒一个线程去处理todo中的binder work，也就是进程C的IPlayer1.start()
                    binder_wakeup_proc_ilocked(proc);
                }
                binder_node_inner_unlock(buf_node);
            }
            //释放进程B申请的buffer
            trace_binder_transaction_buffer_release(buffer);
            binder_transaction_buffer_release(proc, buffer, NULL);
            binder_alloc_free_buf(&proc->alloc, buffer);
            break;
        }

问题3解析：

虽然进程B和进程C同一时刻分别调用IPlayer1.start()和IPlayer1.end()两个不同的方法，但是两个进程调用的Server端都是IPlayer1，也就是binder node是同一个，所以答案和问题2一样。

4 思考一个问题

假如一个进程B，在短时间内，例如一秒内，调用1000次进程A的IPlayer1.start()会发生什么。
第1次IPlayer1.start()：唤醒进程A的一个线程处理IPlayer1.start()，两秒之后完成
第2-1000次IPlayer1.start()：发现IPlayer1对应的binder node正在处理一个oneway的方法，会把所有2~1000次的调用放到binder node的async_todo队列中，等第一次IPlayer1.start()执行完成之后，释放buffer的时候，才能去统一处理这些async_todo中保存的第2-1000次。

那么问题就来了，虽然第2-1000次的调用不会立刻执行，但是已经在进程A中申请了所有的2~1000次IPlayer1.start()所需要的buffer，一个zygote进程A，最大oneway请求的buffer上限为(1MB -8KB)/2 = 508KB，不懂的可以看[007]一次Binder通信最大可以传输多大的数据？这个博客，假设一次IPlayer1.start()，需要申请1KB的buffer，也就意味这在第509次IPlayer1.start()的时候，无法申请到buffer从而导致IPlayer1.start()的Binder调用失败。

在[011]一个看似是系统问题的应用问题的解决过程中解决的就是这个问题。

5 小结

Binder机制是一个非常牛逼的机制，里面有很多小的细节值得我们去深挖，只有完全理解Binder驱动，才能从微观的角度去解决宏观的问题。

IM 小项目总结
参考文章 [023]你真的懂AIDL的oneway嘛？[https://www.jianshu.com/p/0b2...
[023]你真的懂AIDL的oneway嘛？
1 前言用AIDL的人应该都知道下面代码中start和stop方法定义成oneway代表这个Binder接口是异...
AIDL oneway
原文地址：https://mp.weixin.qq.com/s/Jc2mrxeMVTJXudoPx5K4-w on...
AIDL oneway 方法的隐患
结论：不要在服务端oneway接口中处理耗时操作，一旦用于高频调用，服务端又处理耗时，再偶尔碰上cpu负荷高，很可...
你真的懂嘛
今天的雨下的特别大，我一个人走回来的，本来国庆节真的让人想回家，想陪陪家人的，由于个人的原因和你们一样回不了家了，...
你真的懂沟通嘛
工作生活越来越忙，好不容易有个假期可以回家陪陪父母，可你却发现好日子绝不会超过三天，你和父母任何话题争论不过几句就...
你，真的懂孩子嘛
书名：欢迎来到一年级：幼小衔接家长手册作者：卓立出版社：化学工业出版社出版时间：2017年6月这本书对我来...
你真的懂富人思维嘛
你有没有发现从什么时候开始勤俭节约的传统美德，竟然变成了被人诟病的穷人思维，而越会花钱越会赚钱的这些观点呢，却变成...
Android 冷知识
1.binder oneway oneway：调用方(Client)非阻塞（non-block）非 oneway：...
我们真的懂小米嘛？
前几天朋友圈里有人说：小米开发了自动抢红包功能。我第一反应：这功能真屌丝！（大概只有屌丝才会担心错失每一个红包…...

[023]你真的懂AIDL的oneway嘛？

1 前言

1.1 什么是异步调用？

1.2 什么是同步调用？

1.3 为什么会有同步调用和异步调用？

2 提问

2.1 问题1

正确答案：可以同时执行。

2.2 问题2

正确答案：不能同时执行，需要一个一个排队执行。

2.3 问题3

正确答案：不能同时执行，需要一个一个排队执行。

3 代码分析

问题1解析：

问题2解析：

问题3解析：

4 思考一个问题

5 小结

相关文章

IM 小项目总结

[023]你真的懂AIDL的oneway嘛？

AIDL oneway

AIDL oneway 方法的隐患

你真的懂嘛

你真的懂沟通嘛

你，真的懂孩子嘛

你真的懂富人思维嘛

Android 冷知识

我们真的懂小米嘛？

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

android基础知识

android framework