美文网首页
c语言中动态库的使用(启动时链接和运行时链接)

c语言中动态库的使用(启动时链接和运行时链接)

作者: guotianqing | 来源:发表于2018-04-01 13:04 被阅读0次

    背景

    c语言中存在静态库(.a)和动态库(.so)。

    静态库实际上是一些目标文件的集合,只用于链接生成可执行文件阶段。链接器会将程序中使用到函数的代码从库文件中拷贝到应用程序中,一旦链接完成生成可执行文件之后,在执行程序的时候就不需要静态库了。

    特性:

    • 由于每个使用静态库的应用程序都需要拷贝所用函数的代码,所以静态链接的生成的可执行文件会比较大,多个程序运行时占用内存空间比较大(每个程序在内存中都有一份重复的静态库代码)
    • 由于运行的时候不用从外部动态加载额外的库了,速度会比共享库快一些
    • 更换一个静态库或者修改一个静态库后,需要重新编译应用程序

    动态库也叫共享库(share object),在程序链接的时候只是作些标记,然后在程序开始启动运行的时候,动态地加载所需库(模块)。

    特性:

    • 应用程序在运行的时候需要共享库
    • 共享库链接出来的可执行文件比静态库链接出来的要小得多,运行多个程序时占用内存空间比也比静态库方式链接少(因为内存中只有一份共享库代码的拷贝)
    • 由于有一个动态加载的过程所以速度稍慢
    • 更换动态库不需要重新编译程序,只需要更换相应的库即可

    动态库和静态库各有特点,适用于不同的场合。本文主要阐述动态库的使用,重点在于显式运行时链接。


    动态库的产生和使用

    可以通过编译时使用-shared -fPIC参数产生动态库。

    gcc -shared -fPIC -o libtest.so test.c

    动态库生成之后,就可以使用-ltest -L. 的方式使用该动态库。

    /* module.c */
    #include <stdio.h>
    
    int m_pr(void)
    {
        printf("this is module1.\n");
    
        return 0;
    }
    
    /* module.h */
    #ifndef LIB_H
    #define LIB_H
    
    int m_pr(void);
    
    #endif
    

    使用 gcc -shared -fPIC -o libmodule.so module.c生成动态库。

    /* test.c */
    #include <stdio.h>
    #include "module.h"
    
    int main(void)
    {
        printf("------------------------\n");
            m_pr();
        printf("------------------------\n");
    
        return 0;
    }
    

    此时,直接使用 gcc test.c会报错:

    > % gcc test.c 
    /tmp/ccmkXs3N.o:在函数‘main’中:
    test.c:(.text+0x16):对‘m_pr’未定义的引用
    collect2: error: ld returned 1 exit status
    

    很明显,程序不能找到m_pr的定义,程序在编译时就依赖于所使用的库。使用 gcc test.c -lmodule -L.编译生成可执行文件。运行结果如下:

    ./a.out: error while loading shared libraries: libabc.so: cannot open shared object file: No such file or directory
    

    找不到该共享库,即程序启动时依赖于该共享库。执行export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/yao/test/so_lib把库的路径加到LD_LIBRARY_PATH里面就ok了,运行结果如下:

    -> % ./a.out 
    ------------------------
    this is module1.
    ------------------------
    

    显式运行时链接动态库

    显式运行时链接(explicit run-time linking),也叫运行时加载,可以使程序自己在运行时控制加载的指定的模块,并在不需要使用的时候卸载。

    运行时加载使得程序的模块组织更加灵活,可以实现诸如插件、驱动等功能,实现了使用时才加载、使用完即卸载。其特性如下:

    • 不必从程序一开始就将其全部装载进来,减少了程序启动时间和内存使用
    • 程序不必重启就可以实现模块的增加、删除、更新等

    在linux系统中,动态和一般的共享对象在文件格式上看并没有区别。它们的区别主要体现在加载和使用的方式上:

    • 共享对象是由动态链接器在程序启动之前负责装载和链接,由动态链接器自动完成,对应用程序来说是透明的
    • 动态库的装载是通过动态链接器提供的API完成的

    动态链接器提供的API主要有4个:dlopen(), dlsym(), dlclose(), dlerror(),使用它们的时候需要包含 #include <dlfcn.h>

    dlopen()

    void *dlopen(const char *filename, int flag);

    打开一个动态库,并将其加载到进程的地址空间,完成初始化过程。

    第一个参数是被加载动态库的路径。如果是绝对路径,函数会尝试直接打开此动态库,如果是相对路径,函数会按以下顺序查找该动态库文件:

    1. 查找环境变量LD_LIBRARY_PATH指定的目录
    2. 查找由 /etc/ld.so.cache里面指定的共享库路径
    3. /lib, /usr/lib

    注意,如果把该参数设置为0,将会返回全局符号表的句柄。也就是说,我们可以在运行时找到全局符号表里的任何一个符号并执行它们。

    第二个参数是函数符号的解析方式。取值可以是 RTLD_LAZY/RTLD_NOW|RTLD_GLOBAL,其中,RTLD_LAZY表示延迟绑定,当函数第一次被调用时才进行绑定,而RTLD_NOW则是模块被加载时就进行绑定。这两种绑定方式只能选择一个,而它们都可以与RTLD_GLOBAL一起使用,表示将被加载的模块的全局符号合并到进程的全局符号表中,使得以后加载的模块可以使用这些符号。

    dlopen的返回值是被加载模块的句柄,供后面调用其他函数时使用。如果加载失败,返回 NULL。如果模块已经被加载过了,返回同一个句柄。

    dlsym()

    void *dlsym(void *handle, char *symbol);

    找到指定句柄中的符号。

    第一个参数是使用dlopen返回的句柄,第二个参数是所需要查找的符号,是一个以'\0'结尾的字符串。如果找到了该符号,返回符号的值,如果未找到符号,则返回 NULL

    • 如果查找的是个函数,返回函数的地址
    • 如果是变量,返回变量的地址
    • 如果是常量,返回常量的值

    如果返回的常量值刚好是NULL或0,就需要调用dlerror()函数判断是否调用成功。如果返回NULL,则调用成功且符号找到。如果返回错误信息,则未找到该符号

    dlclose()

    int dlclose(void *handle);

    dlopen作用相反,关闭打开的句柄,卸载已加载的某个模块。

    系统会维持一个加载引用计数器,每次使用dlopen加载某个模块时,相应的计数器加1,每次使用dlclose卸载某个模块时,相应的计数器减1。只有当计数器值减到0时,模块才被真正地卸载掉。

    dlerror()

    char *dlerror(void);

    每次调用dlopen, dlsym, dlclose之后都可以调用dlerror()来判断上一次调用是否成功。

    • 返回NULL,则上一次调用成功
    • 上一次调用失败,则返回相应的错误信息

    例子

    修改上述test.c为下:

    /* test.c */
    #include <stdio.h>
    #include <dlfcn.h>
    
    int (*module_pr)(void);
    
    int main(void)
    {
        void *h;
    
        printf("------------------------\n");
        h = dlopen("./libabc.so", RTLD_NOW|RTLD_GLOBAL);
        if (!h) {
            printf("dlopen error:%s\n", dlerror());
            return -1;
        }
    
        module_pr = dlsym(h, "m_pr");
        if (dlerror() != NULL) {
            printf("dlsym m_pr error:%s\n", dlerror());
            return -1;
        }
    
        module_pr();
        dlclose(h);
        dlerror();
    
        printf("------------------------\n");
    
        return 0;
    }
    

    执行 gcc test.c,报错如下:

    -> % gcc test.c 
    /tmp/ccM9fcKC.o:在函数‘main’中:
    test.c:(.text+0x25):对‘dlopen’未定义的引用
    test.c:(.text+0x35):对‘dlerror’未定义的引用
    test.c:(.text+0x60):对‘dlsym’未定义的引用
    test.c:(.text+0x6a):对‘dlerror’未定义的引用
    test.c:(.text+0x73):对‘dlerror’未定义的引用
    test.c:(.text+0x9d):对‘dlclose’未定义的引用
    test.c:(.text+0xa2):对‘dlerror’未定义的引用
    collect2: error: ld returned 1 exit status
    

    修改为 gcc test.c -ldl编译通过,运行结果如下:

    -> % ./a.out 
    ------------------------
    this is module1.
    ------------------------
    

    可见,程序编译时已经不再依赖动态库了,只有到运行时才动态加载所需要的库。


    总结

    在使用动态库时,可以选择显式运行时链接,但这样会增加一些代码。

    对于服务器端的应用程序来说,显式运行时链接可以在程序不重启的情况下加载更新后的动态库,这对于7*24小时工作的服务器来说是至关重要的。

    不同的项目可以根据实际情况选择不同的实现方式。

    相关文章

      网友评论

          本文标题:c语言中动态库的使用(启动时链接和运行时链接)

          本文链接:https://www.haomeiwen.com/subject/fuwocftx.html