美文网首页NDK
视频图像处理中的错帧同步是怎么实现的?

视频图像处理中的错帧同步是怎么实现的?

作者: 字节流动 | 来源:发表于2020-04-22 22:33 被阅读0次

    该原创文章首发于微信公众号:字节流动

    为什么会用到错帧同步?

    一般 Android 系统相机的最高帧率在 30 FPS 左右,当帧率低于 20 FPS 时,用户可以明显感觉到相机画面卡顿和延迟。

    我们在做相机预览和视频流处理时,对每帧图像处理时间过长(超过 30 ms)就很容易造成画面卡顿,这个场景就需要用到错帧同步方法去提升画面的流畅度。

    错帧同步,简单来说就是把当前的几帧缓冲到子线程中处理,主线程直接返回子线程之前的处理结果,属于典型的以空间换时间策略。

    错帧同步策略也有不足之处,它不能在子线程中缓冲太多的帧,否则造成画面延迟。另外,每个子线程分配的任务也要均衡(即每帧在子线程中的处理时间大致相同),不然会因为 CPU 线程调度的时间消耗适得其反。

    错帧同步的原理

    错帧同步的原理如上图所示,我们开启三个线程:一个主线程,两个工作线程,每一帧图像的处理任务分为 2 步,第一个工作线程完成第一步处理,第二个工作线程完成第二步处理,每一帧都要经过这两步的处理。

    当主线程输入第 n + 1 帧到第一个工作线程后,主线程会等待第二个工作线程中第 n 帧的处理结果然后返回,这种情况下你肯定会问第 0 帧怎么办?第 0 帧就直接返回就行了。

    这些步骤下来,可以看成第 n+1 帧和第 n 帧在 2 个工作线程中同时处理,若忽略 CPU 线程调度时间,2 线程错帧可以提升一倍的性能(性能提升情况,下面会给出实测数据)。

    错帧同步的简单实现

    错帧同步在实现上类似于“生产者-消费者”模式,我们借助于 C 语言信号量 #include <semaphore.h> 可以很方便的实现错帧同步模型。

    C 的信号量常用的几个 API :

    --------------------------------------------------------------------
    int sem_init(sem_t *sem, int pshared, unsigned int value);
        功能:初始化信号量
        参数:
            sem:指定要初始化的信号量
            pshared:0:应用于多线程
                    非 0:多进程
            value:指定了信号量的初始值
        返回值:0 成功
              -1 失败
    
    ----------------------------------------------------------------------
    int sem_destroy(sem_t *sem);
        功能:销毁信号量
        参数:sem:指定要销毁的信号量
        返回值:0 成功
              -1 错误 
    
    ----------------------------------------------------------------------
    int sem_post(sem_t *sem);
    
        功能:信号量的值加 1 操作
        参数:
            sem:指定的信号量,就是这个信号量加 1 
        返回值:0 成功
              -1 错误 
    
    -----------------------------------------------------------------------
    
    int sem_wait(sem_t *sem);
        功能:信号量的值减 1 , 如果信号量的值为 0 , 阻塞等待
        参数:
            sem:指定的信号量, 如果信号量的值为 0, 阻塞等待, 否则信号量的值减 1
        返回值:0 成功
              -1 错误
    
    

    在这里为了简化代码逻辑,我们用字符串来表示视频帧,每个工作线程对输入的字符串进行标记,表示工作线程对视频帧做了处理,最后的输出(第 0 帧除外)都是经过工作线程标记过的字符串。

    //初始化
    void AsyncFramework::Init() {
        LOGCATE("AsyncFramework::Init");
        memset(work_buffers, 0, sizeof(work_buffers));
        work_thread_running = true;
        main_thread_running = true;
    
        index = 0;
    
        // 初始化 3 个信号量
        sem_init(&main_sem, 0, 0);
        sem_init(&first_thread_sem, 0, 0);
        sem_init(&second_thread_sem, 0, 0);
    
        // WORK_THREAD_NUM = 2 ,为 2 个工作线程申请 2 块 buffer
        for (int i = 0; i < WORK_THREAD_NUM; ++i) {
            work_buffers[i] = static_cast<char *>(malloc(WORK_BUFFER_SIZE));
        }
    
        // 启动三个线程
        main_thread = new thread(MainThreadProcess);
        first_thread = new thread(FirstStepProcess);
        second_thread = new thread(SecondStepProcess);
    
    }
    
    // 反初始化
    void AsyncFramework::UnInit() {
        LOGCATE("AsyncFramework::UnInit");
        //等待三个线程结束
        main_thread_running = false;
        main_thread->join();
        delete main_thread;
        main_thread = nullptr;
    
        work_thread_running = false;
        sem_post(&first_thread_sem);
        sem_post(&second_thread_sem);
        first_thread->join();
        second_thread->join();
    
        delete first_thread;
        first_thread = nullptr;
        delete second_thread;
        second_thread = nullptr;
    
        //销毁信号量
        sem_destroy(&main_sem);
        sem_destroy(&first_thread_sem);
        sem_destroy(&second_thread_sem);
    
        //释放缓冲区
        for (int i = 0; i < WORK_THREAD_NUM; ++i) {
            if (work_buffers[i]) {
                free(work_buffers[i]);
                work_buffers[i] = nullptr;
            }
        }
    
    }
    

    主线程的逻辑就是不断地生成“视频帧”,将“视频帧”传给第一个工作线程进行第一步处理,然后等待第二个工作线程的处理结果。

    void AsyncFramework::MainThreadProcess() {
        LOGCATE("AsyncFramework::MainThreadProcess start");
        while (main_thread_running) {
            memset(work_buffers[index % WORK_THREAD_NUM], 0, WORK_BUFFER_SIZE);
            sprintf(work_buffers[index % WORK_THREAD_NUM], "FrameIndex=%d ", index);
            //通知第一个工作线程处理
            sem_post(&first_thread_sem);
            if (index == 0) {
                //第 0 帧直接返回,不交给工作线程处理
                LOGCATE("AsyncFramework::MainThreadProcess %s", work_buffers[index % WORK_THREAD_NUM]);
                index++;
                continue;
            } else {
                //等待第二个工作线程的处理结果 
                sem_wait(&main_sem);
            }
            LOGCATE("AsyncFramework::MainThreadProcess %s", work_buffers[(index - 1) % WORK_THREAD_NUM]);
            index++;
            if (index == 100) break;//生成100帧
        }
        LOGCATE("AsyncFramework::MainThreadProcess end");
    
    }
    

    2个工作线程的处理逻辑类似,第一个工作线程收到主线程发来的信号,然后进行第一步处理,处理完成后通知第二个工作线程进行第二步处理,等到第二步处理完成后再通知主线程结束等待,取出处理结果。

    void AsyncFramework::FirstStepProcess() {
        LOGCATE("AsyncFramework::FirstStepProcess start");
        int index = 0;
        while (true) {
            //等待主线程发来的信号
            sem_wait(&first_thread_sem);
            if(!work_thread_running) break;
            LOGCATE("AsyncFramework::FirstStepProcess index=%d", index);
            strcat(work_buffers[index % WORK_THREAD_NUM], "FirstStep ");
            //休眠模拟处理耗时
            this_thread::sleep_for(chrono::milliseconds(200));
            //处理完成后通知第二个工作线程进行第二步处理
            sem_post(&second_thread_sem);
            index++;
        }
        LOGCATE("AsyncFramework::FirstStepProcess end");
    
    }
    
    void AsyncFramework::SecondStepProcess() {
        LOGCATE("AsyncFramework::SecondStepProcess start");
        int index = 0;
        while (true) {
            //等待第一个工作线程发来的信号
            sem_wait(&second_thread_sem);
            if(!work_thread_running) break;
            LOGCATE("AsyncFramework::SecondStepProces index=%d", index);
            strcat(work_buffers[index % WORK_THREAD_NUM], "SecondStep");
            //休眠模拟处理耗时
            this_thread::sleep_for(chrono::milliseconds(200));
            //第二步处理完成后通知主线程结束等待
            sem_post(&main_sem);
            index++;
        }
        LOGCATE("AsyncFramework::SecondStepProcess end");
    }
    

    主线程打印的处理结果(第 0 帧直接返回,没被处理):


    主线程打印的处理结果

    我们设定视频帧的 2 步处理一共耗时 400 ms (各休眠 200 ms),由于采用错帧同步方式,主线程耗时只有 200 ms 左右,性能提升一倍。


    main_thread_cost_time

    联系与交流

    技术交流可以添加我的微信:Byte-Flow

    相关文章

      网友评论

        本文标题:视频图像处理中的错帧同步是怎么实现的?

        本文链接:https://www.haomeiwen.com/subject/quwgihtx.html