美文网首页
APR分析-高级IO篇

APR分析-高级IO篇

作者: 偷风筝的人_ | 来源:发表于2017-12-01 22:04 被阅读0次

APR分析-高级IO篇

近两天稍轻闲了些,便抓紧时间学习、学习再学习。在“APR分析-文件IO篇”,我们只分析了最基本的I/O操作,如文件的open、close、write和read。当然File

I/O操作不止这些,在这一篇中我们来看看APR提供的一些高级I/O设施,包括记录锁、I/O多路复用和内存映射文件(内存映射文件将和共享内存一起分析)。

一、记录锁或(区域锁)[注1]

我见过的对记录锁讲解最详细的书就是《Unix高级环境编程》,特别是关于进程、文件描述符和记录锁三者之间关系的讲解更是让人受益匪浅,有此书的朋友一定不要放过哟。这里将其中的三原则摘录到这:

关于记录锁的自动继承和释放有三条规则:

(1)锁与进程、文件两方面有关。这有两重含意:第一重很明显,当一个进程终止时,它所建立的锁全部释放;第二重意思就不很明显,任何时候关闭一个描述符时,则该进程通过这一描述符可以存访的文件上的任何一把锁都被释放(这些锁都是该进程设置的)。

(2)由fork产生的子程序不继承父进程所设置的锁。这意味着,若一个进程得到一把锁,然后调用fork,那么对于父进程获得的锁而言,子进程被视为另一个进程,对于从父进程处继承过来的任一描述符,子进程要调用fcntl以获得它自己的锁。这与锁的作用是相一致的。锁的作用是阻止多个进程同时写同一个文件(或同一文件区域)。如果子进程继承父进程的锁,则父、子进程就可以同时写同一个文件。

(3)在执行exec后,新程序可以继承原执行程序的锁。

话归正题谈APR的记录锁,平心而论APR的提供的加索和解锁接口并没有什么独到的地方,APR之所以将之封装起来,无非是为了提供一个统一的跨平台接口,并且不破坏APR整体代码风格的一致性。APR记录锁源码位置在$(APR_HOME)/file_io/unix目录下flock.c,头文件仍然是apr_file_io.h。apr_file_lock和apr_file_unlock仅提供对整个文件的加锁和解锁,而并不支持对文件中任意范围数据的加锁和解锁。至于该锁是建议锁(advisory

lock)还是强制锁(mandatory lock),需要看具体的平台的实现了。两个函数均利用fcntl实现记录锁功能(前提是所在平台支持fcntl,由于fcntl是POSIX标准,绝大多数平台都支持)。代码中有一处值得鉴赏:

while ((rc = fcntl(thefile->filedes, fc, &l)) < 0&& errno == EINTR)

continue;

这里这么做的原因就是考虑到fcntl的调用可能被某信号中断,一旦中断我们去要重启fcntl函数。

二、I/O多路复用[注2]

在经典的《Unix网络编程第1卷》Chapter

6中作者详细介绍了五种I/O模型,分别为:

- blocking I/O

- nonblocking I/O

- I/O multiplexing (select and poll)

- signal driven I/O (SIGIO)

- asynchronous I/O (the POSIX aio_functions)

作者同时对这5种I/O模型作了很详细的对比分析,很值得一看。这里所说的I/O多路复用就是第三种模型,它既解决了Blocking

I/O数据处理不及时,又解决了Non-Blocking I/O采用轮旬的CPU浪费问题,同时它与异步I/O不同的是它得到了各大平台的广泛支持。

APR I/O多路复用源码主要在$(APR_HOME)/poll/unix目录下的poll.c和select.c中,头文件为apr_poll.h。APR提供统一的apr_poll接口,但是apr_pollset_t结构定义和apr_poll的实现则根据宏POLLSET_USES_SELECT、POLL_USES_POLL和POLLSET_USES_POLL的定义与否而不同。这里拿poll的实现(That

is使用poll来实现apr_poll及apr_pollset_xx相关,与之对应的是使用select来实现apr_poll及apr_pollset_xx相关)来分析:在poll的实现下,apr_pollset_t的定义如下:

/* in poll.c */

struct apr_pollset_t

{

apr_pool_t *pool;

apr_uint32_t nelts;

apr_uint32_t nalloc;

struct pollfd *pollset;

apr_pollfd_t *query_set;

apr_pollfd_t *result_set;

};

统一的apr_pollfd_t定义如下:

/* in apr_poll.h */

struct apr_pollfd_t {

apr_pool_t*p;             /* associated pool */

apr_datatype_e desc_type;   /*descriptor type */

apr_int16_treqevents;      /* requested events */

apr_int16_trtnevents;      /* returned events */

apr_descriptordesc;        /* @see apr_descriptor */

void*client_data;          /* allowsapp to associate context */

};

把数据结构定义贴出来便于后面分析时参照理解。

假设我们像这样apr_pollset_create(&mypollset,10, p, 0)调用,那么在apr_pollset_create后,我们可以用图示来表示mypollset变量的状态:

mypollset

-------

nalloc  ----> 10 /*该mypollset的“容量”,在create的时候由参数指定*/

-------

nelts   ----> 0  /*刚初始化,mypollset中并没有任何element,之后每add一次,nelts就+1

*/

-------

---------------------------------------------

pollset --------->  pollset[0] | pollset[1] |...|pollset[nalloc-1]

---------------------------------------------

-------

-----------------------------------------------------

query_set --------->  query_set[0] | query_set[1] |...|query_set[nalloc-1]

-----------------------------------------------------

-------

---------------------------------------------------------

result_set --------->  result_set[0] | result_set[1] |...|result_set[nalloc-1]

---------------------------------------------------------

-------

pollset、query_set和result_set这几个集合的关系通过下图说明:

apr_pollfd_t *descriptor ---> [pollset_add]--------> query_set ------ [pollset_poll] -----> result_set (输出)

|                                                                                           /|/

------------------->pollset ------ [pollset_poll] --------------------

apr_pollset_xx系列是改版后APR I/O复用新增的接口集,它以apr_pollset_t作为其管理的基本单位,其中apr_pollset_poll用于监视pollset中的所有descriptor(s)。而apr_poll则是旧版的APR

I/O复用接口,它同样可以实现apr_pollset_poll的功能,只是它的基本管理单位是apr_pollfd_t,其相关函数还包括apr_poll_setup、apr_poll_socket_add等在apr-1.1.1版中已看不到的几个接口。新版本中建议使用apr_pollset_poll,起码APR的测试用例(testpoll.c)是这么做的。

select实现的思路与poll实现的思路是一致的,只是apr_pollset_t的结构不同,原因不言自明。

三、总结

由于APR对高级I/O的封装很“薄”,所以基本上没有太多很精致的东西。

四、参考资料

1、《Unix高级环境编程》

2、《Unix网络编程卷1、2》

[注1]

对于Unix,“记录”这个定语也是误用,因为Unix内核根本没有使用文件记录这种概念。一个更适合的术语可能是“区域锁”,因为它锁定的只是文件的一个区域(也可能是整个文件)--摘自《Unix高级环境编程》。

[注2]

在《Unix网络编程卷1》译者译为"多路复用",在《Unix高级环境编程》中译者译为"多路转接",我更倾向于前者。I/O多路复用其英文为"I/OMultiplexing"。

相关文章

  • APR分析-高级IO篇

    APR分析-高级IO篇 近两天稍轻闲了些,便抓紧时间学习、学习再学习。在“APR分析-文件IO篇”,我们只分析了最...

  • APR分析-文件IO篇

    APR分析-文件IO篇 文件I/O在Unix下占据着非常重要的地位,曾有一句经典语句绝对可以说明file在Unix...

  • APR分析-网络IO篇

    APR分析-网络IO篇 “这个世界如果没有了网络就好比没有了石油、没有了电一样,是多么的可怕呀。”相信世界上已经有...

  • APR分析-进程篇

    APR分析-进程篇 Apache Server的进程调度一直为人所称道,Apache 2.0推出的APR对进程进行...

  • APR分析-线程篇

    APR分析-线程篇 并行一直是程序设计领域的难点,而线程是并行的一种重要的手段,而且线程的一些特性也能在进程并行时...

  • APR分析-环篇

    APR分析-环篇 APR中少见对数据结构的封装,好像唯一例外的就是其对循环链表,即环(RING)的封装。 在大学的...

  • APR分析-设计篇

    APR分析-设计篇 作为一个可移植的运行时环境,APR设计当然是很精妙的,但精妙的同时对使用者有一些限制。 APR...

  • APR分析-内存篇

    APR分析-内存篇 内存管理一直是让C程序员头痛的问题,作为一个通用接口集,APR当然也提供其自己的内存管理接口-...

  • APR分析信号篇

    APR分析-信号篇 U know信号是Unix的重要系统机制。信号机制使用起来很简单,但是理解起来有并不是那么Ea...

  • APR分析-整体篇

    APR分析-整体篇 由于部门所使用的底层库与Apache Server有着“一定的渊源”,所以总有一种想看看Apa...

网友评论

      本文标题:APR分析-高级IO篇

      本文链接:https://www.haomeiwen.com/subject/fbkgbxtx.html