Apache源代码全景分析.pdf-道客多多

资源描述

1、Apache内存池内幕(1)对于APR中的所有的对象中，内存池对象应该是其余对象内存分配的基础，不仅是APR中的对象，而且对于整个Apache中的大部分对象的内存都是从内存池中进行分配的，因此我们将把内存池作为整个APR的基础。2.1 内存池概述在C语言中，内存管理的问题臭名昭著，一直是开发人员最头疼的问题。对于小型程序而言，少许的内存问题，比如内存泄露可能还能忍受，但是对于 Apache这种大负载量的服务器而言，内存的问题变得尤其重要，因为丝毫的内存泄露以及频繁的内存分配都可能导致服务器的效率下降甚至崩溃。通常情况下，内存的分配和通常都是 a c和 ee 进行的。这得，可能种人

2、的问题。对一内存的通常导致，而一直不导致内存泄露，且得服务器能大大下降。为在大而且的Apache中currency1内在的内存管理问题，Apache的开发“一基于池概的内存管理fifl，最这fiAPR中为通的内存管理fifl。在这fifl中，概是池的概。Apache中的内存分配的基”都是池，程池，池。内存池通常是一大的内存，一分配，要的直池中，而不要重分配，这 currency1的频繁的 a c作，而且一fi ，内存的内存不分配，这内存不，们存在内存池中，内存池的这内存将的。于Apache中的大部分的分配都是从内存池中分配的，

3、因此对于大部分的Apache ，如其内部要进行分配，的中是有一个内存池，该内存池分配内存的内存池，比如下的个APR C AR ap a a hea e ap a a c p ap p pc ap a a hea e a AP C AR O ST ap a u ap bucke e a i e p ap bucke a aap p p 于在的内部要进行内存分配，因此这个的中都定一个ap p 的”，以名内存分配的内存池。在的大部分过程中我们对于该将不再余的解。Apache中的内存池不是仅仅一个内存池，相反而是存在个内存池，这内存池之形层 ”。如 Ap

4、ache中仅仅存在一个内存池的话，潜在的问题是所有的内存分配都这个池，而且最要命的这内存必须在整个Apache关闭才，这一点不是合情合理，为此 Apache中据处理阶段的周期长短引出子内存池的概，与之对应的是父内存池以及内存池的概，们的唯一区别是存在的周期的不而已。比如对于HTTP连而言，种内存池连内存池和请求内存池。于一个连可能含个请求，因此连的生存周期是比一个请求的周期长，为此连处理中所要的内存则从连内存池中分配，而请求则从请求内存池中分配。而一个请求处理完毕请求内存池，一个连处理连内存池。内存池在整个Apache运行期都

5、存在。Apache中一个内存池的层 ”图可以大致如下描述内存池的层图2.2 内存池分配点在解内存池的概之前，我们首先解一内存池分配点的概。为能够fi便的对分配的内存进行管理，Apache中内存点的概描述每分配的内存。其”类型则描述为ap e e ，该”定义在文件Ap a ca .h中，其定义如下 / ba ic e e uc u e /uc ap e e ap e e ex /max_free_index = APR_ALLOCATOR_MAX_FREE_UNLIMITED;*allocator = new_allocator;return APR_SUCCESS;分配子的“常的

6、简，的则是最通常的 malloc，分配大小为SIZEOF_ALLOCATOR_T APR_ALIGN_DEFAULT(sizeof(apr_allocator_t)大小。这分配的 MAX_INDEX 个针变量。一旦分配完毕，将max_free_index初始化为APR_ALLOCATOR_MAX_FREE_UNLIMITED，该”实际为0，表分配子对于闲点的大小不设，意着点再大，不。“ ，”中的max_inde，current_free_index都初始化为0，这实际上是 memset 初始化的。一旦“完毕，将 “的分配子。不过此的分配子中的free 中不含任何的实

7、际的内存点链表。对分配子的常的下一步应该是对”员进行初始化。主要的初始化工作是设置归还作的 max_free_index。在我们看，对于 malloc分配的内存，如其大小小于该”，这不，而是归还内存池，内存池身的，这内存才真作；如内存的大小大于这个”，内存将直作。这个”的设置 apr_allocator_max_free_set完 APR_DECLARE(void) apr_allocator_max_free_set(apr_allocator_t *allocator,apr_size_t in_size)apr_uint32_t max_free_

8、index;apr_uint32_t size = (APR_UINT32_TRUNC_CAST)in_size;max_free_index = APR_ALIGN(size, BOUNDARY_SIZE) BOUNDARY_INDEX;allocator-current_free_index += max_free_index;allocator-current_free_index -= allocator-max_free_index;allocator-max_free_index = max_free_index;if (allocator-current_free_index m

9、ax_free_index)allocator-current_free_index = max_free_index; 中的 size过的对整”分配子”中的 max_free_index。max_free_index之外，外一个重要的员是current_free_index，该员录前内存池中实际的最大的内存大小。，的”不允许出max_free_index 的范围。与分配子的“对应的则是分配子的，的是 apr_allocator_destroy。分配子的，我们要fl 下 fi 的内容都fl的 (1)、分配子身的内存，这个可以直 free处理(2)、于分配子中

10、内嵌的free 都向一个实际的点链表，因此必须这链表都fl的。在链表的，通过一旦得头点，可以沿着next遍历链表中的所有点。必须要注意的是种之前的顺序问题。fl的顺序应该是链表最早；其才是分配子身内存的。Apache中对应该部分是如下 APR_DECLARE(void) apr_allocator_destroy(apr_allocator_t *allocator)apr_uint32_t index;apr_memnode_t *node, *ref;for (index = 0; index freeindex;while (node = *ref) !=

11、NULL) *ref = node-next;free(node);free(allocator);Apache内存池内幕(3)2.3.3分配子内存分配分配子分配内存是最终的的。Apache对外提供的分配子分配内存的是apr_allocator_alloc，而实际在内部，该的则是allocator_alloc。allocator_alloc 型声如下 apr_memnode_t *allocator_alloc(apr_allocator_t *allocator, apr_size_t size)的常简，allocator则是内存分配的的分配子，而size则是要进行分配的

12、大小。如分配，则分配的apr_memnode_t”。apr_memnode_t *node, *ref;apr_uint32_t max_index;apr_size_t i, index;size = APR_ALIGN(size + APR_MEMNODE_T_SIZE, BOUNDARY_SIZE);if (size BOUNDARY_INDEX) - 1;if (index APR_UINT32_MAX) return NULL;所的一件事情是我们前所的分配则整实际分配的大小如不 8K，则以8K；则整为4K的整。还将该与该点对应的引大小。一旦得引大小，

13、点链表。至此Apache可以寻合的点进行内存分配。从分配子中分配内存必须考虑下三种情况 (1)、如要分配的点大小分配子中的“ 则点”能够足， indexmax_index。此，能够足分配的最小点是index 引对应的链表点，但此该引对应的链表可能为，因此将沿着直一个可的不为点直末尾。程序中还出外一种以及不的因 NOTE: an optimization would be to check allocator-freeindex first and if no node is present, directly use allocator-freemax_

14、index. This seems like overkill though and could cause memory waste.外一种fifl 是首先直检 allocator-freeindex，一旦发现不可，直最大的引 allocator-freemax_index，不过这种可能导致内存的浪费。Apache 的则是“最合 ” 则，这种则，的一个内存肯定是最合的。下的斜体所作的如此 if (index max_index) max_index = allocator-max_index;ref = i = index;while (*ref = NULL max_i

15、ndex-;while (*ref = NULL allocator-max_index = max_index;allocator-current_free_index += node-index;if (allocator-current_free_index allocator-max_free_index)allocator-current_free_index = allocator-max_free_index;node-next = NULL;node-first_avail = (char *)node + APR_MEMNODE_T_SIZE;return node;(2)、

16、如分配的点大小过 “ 则点”中的最大点，将考虑引0链表。引0链表中的点的实际大小通过员变量index进行。在通过next遍历引0链表的，将要的大小index和实际的点的大小node-index进行比较。如 indexnode-index，则该点足分配要求，此必须继续遍历。一旦合的可供分配的点大小，将整 node-first_avail针向实际可的闲。外还要整分配子中的current_free_index为的分配的 ”。(3)、如在free0链表中都不合的供分配，此能“起炉灶”。能的事情是 malloc分配实际大小的，初始化点的个变量，

17、，如下 if (node = malloc(size) = NULL)return NULL;node-next = NULL;node-index = index;node-first_avail = (char *)node + APR_MEMNODE_T_SIZE;node-endp = (char *)node + size;下我们看一个Apache中典型的分配子分配的情况，下的你可以在worker.c中 apr_allocator_t *allocator;apr_allocator_create(apr_allocator_max_free_set(allocator,

18、ap_max_mem_free);apr_pool_create_ex(apr_allocator_owner_set(allocator, ptrans);我顺着这段下阅读的，我感觉困惑。一个分配子“初始，内部的free 中的引链表都为，因此我们在 apr_pool_create_ex 中 node = allocator_alloc(allocator, MIN_ALLOC - APR_MEMNODE_T_SIZE) = NULL的，所要的内存不可能引链表内的点中，而能地分配，这点一旦分配，们作为内存池的点而，但是分配的点没有立与free 进行关联，没有对

19、free 中的元进行”。这，如不将点与free 进行“挂 ”，将永远都不可能形图一所示链表”。们才挂 free 中的呢？所有的挂过程都是在点的才进行的。2.3.4分配子内存如前所描述的，在分配内存的，Apache首先尝试现有的链表中合的，如没有合的内存区的话，Apache必须上述的分配则进行实际的内存分配。但是实际的内存不立挂链表中，有的，这区才挂内存中。所以从这个角度而言，分配子内存的不是真的将内存 free ，而将其分配链表池中。Apache中提供的内存是apr_allocator_free。不过该仅仅是对外提供的而已，在内存

20、的则实际上是allocator_free。allocator_free 的型如下 static APR_INLINE void allocator_free(apr_allocator_t *allocator, apr_memnode_t *node)中，node是要的内存点，其最终归还分配子allocator。apr_memnode_t *next, *freelist = NULL;apr_uint32_t index, max_index;apr_uint32_t max_free_index, current_free_index;max_index = allocator-

21、max_index;max_free_index = allocator-max_free_index;current_free_index = allocator-current_free_index;于node不仅仅可能是一个点，而且可能是一个点链表，因此如要完该链表中的点，则必须通过点中的next进行依遍历，因此下的环是整个过程的框架” do next = node-next;index = node-index; while (node = next) != NULL);对于每个点，我们将据的引大小（内存大小）不的处理 (1)、如点的大小过完的阙”max_f

22、ree_index，我们不能将其简的归还引链表中，而必须将其完归还作。将所有的这的要完的点存在链表freelist中，待所有的点遍历完毕，要 freelist 可以所有的必须的点，如下所示 if (max_free_index != APR_ALLOCATOR_MAX_FREE_UNLIMITEDfreelist = node;如 max_free_index为APR_ALLOCATOR_MAX_FREE_UNLIMITED则意着没有。任何内存，不管有大，APR都不将其归还作。(2)、如 indexmax_index，则必须重 max_index的大

23、小，将该点插入链表的首部，作为首点，可以描述如下 else if (index next = allocator-freeindex) = NULLallocator-freeindex = node;current_free_index -= index;(3)、如点过“ 则点”的范围，但是没有出点的范围，此我们则可以将其置于“ 引0”链表的首部中。如下 else node-next = allocator-free0;allocator-free0 = node;current_free_index -= index;待所有的点处理完毕，我们还必须整分配子中的个员变量，

24、 max_index和current_free_index。不要 freelist链表。allocator-max_index = max_index;allocator-current_free_index = current_free_index;while (freelist != NULL) node = freelist;freelist = node-next;free(node);上的工作都完，整个点的完毕。事实上整个内存池中的内存是通过上的不断地而”起的。一旦”内存池，下一的则可以直内存池中获。2.3.5分配子内存管理流程据上的描述，我们现在串起看

25、一整个分配子工作的流程。假如存在下一段 1. apr_allocator_t *allocator;2. apr_allocator_create(3. apr_allocator_max_free_set(allocator, 0);/简起见，不进行任何 4. apr_memnode_t *memnode1 = apr_allocator_alloc(allocator, 3000);5. apr_allocator_free(memnode1);6. apr_memnode_t *memnode2 = apr_allocator_alloc(allocator, 3000);7. a

26、pr_allocator_free(memnode2);8. apr_memnode_t *memnode3 = apr_allocator_alloc(allocator, 3000);9. apr_allocator_free(memnode3);一行执行完毕，“的分配子示意图如下图所以，该图中尚有任何的内存可供分配在四行中，要内存分配子分配2000的，但此没有任何可供分配(index allocator-max_index， allocator-free0=NULL)，因此分配子将直向作8K 的，剔 ” 头的大小，实际可的内存大小为 8k-APR_ME

27、MNODE_T_SIZE。执行完五行的，该内存将归还分配子，存在引1链表中。下图中的虚剔为前的状态，反之为的状态。如下图现在我们考虑六行和七行的执行。再向分配子请3000K的内存的，过发现，该内存必须引为1链表中获。如引1链表为NULL，则重前的步骤；Apache内存池内幕(4)2. 内存池2.4.1内存池概述在解内存分配子的概之，我们其实已解Apache中内存分配的。不过Apache中内存的层 ”关则是内存池负责织，其据” apr_pool_t定义在apr_pools.c中，定义如下 struct apr_pool_t apr_pool_t *pa

28、rent;apr_pool_t *child;apr_pool_t *sibling;apr_pool_t *ref; / 于向内存池身cleanup_t *cleanups;apr_allocator_t *allocator;struct process_chain *subprocesses;apr_abortfunc_t abort_fn;apr_hash_t *user_data;const char *tag;#if !APR_POOL_DEBUGapr_memnode_t *active;apr_memnode_t *self; /* The node containing th

29、e pool itself */char *self_first_avail;#else /* APR_POOL_DEBUG */debug_node_t *nodes;const char *file_line;apr_uint32_t creation_flags;unsigned int stat_alloc;unsigned int stat_total_alloc;unsigned int stat_clear;#if APR_HAS_THREADSapr_os_thread_t owner;apr_thread_mutex_t *mutex;#endif /* APR_HAS_TH

30、READS */#endif /* APR_POOL_DEBUG */#ifdef NETWAREapr_os_proc_t owner_proc;#endif /* defined(NETWARE) */;Apache中存在的内存池个通常于一个，们之形树型层 ”。每个内存池所存的内容以及其存周期都不一，比如连内存池在整个HTTP连期存在，一旦连束，内存池；请求内存池则周期要相对短，仅仅在某个请求周期内存存在，一旦请求束，请求内存池。不过每个内存池都具有一个apr_pool_t”。整个内存池层树通过parent、child以及sibling三个变量”起。parent向

31、前内存池的父内存池；child向前内存池的子内存池；而sibing则向前内存池的兄弟内存池。因此整个内存池树”可以图3.3描述图3.3 内存池层树”图在上的图中，我们是表示层 ”，因此是 child和sibling 个员，而忽的 parent 的变量。从上的图中我们可以看出点具有 n 个孩子点 child1，child2，child3childn。而child1，child2，child3以及childn 们于一个父亲，而且处于层树的一层，因此们通过链表连，为兄弟点。 child10和child11都是child1的子内存池点，为兄弟点。child21是

32、child2的唯一的子点。其余点类“。此之外 apr_pool_t ” 中最重要的员变量是 active 。图3.4 Apache中提供大量的内存池管理，们的能和名称归纳在表 3.2中。内存池作名称能简描述初始化 ap p ii ia ize 对内存池中要的内部变量进行初始化 ap p e ia e 主要在终止内存池内部的”“ ap p c ea e exap p c ea e ex ebu “一个的内存池，外还一个试版清 ap p c ea ap p c ea ebu 清内存池中的所有的内存，外一个试版ap p e 2.4.2内存池的初始化内存池

33、的初始化是通过 apr_pool_initialize实现的，在内部完下件事情 APR_DECLARE(apr_status_t) apr_pool_initialize(void)apr_status_t rv;if (apr_pools_initialized+)return APR_SUCCESS;(1)、fl Apache中“一个内存池，为此，Apache中 apr_pools_initialized进行录。 apr_pools_initialized初始”为0，初始化该” 改为1。每初始化之前都检该”，有”为0的才允许继续执行初始化作，则直。通过这种手段可以fl 有

34、一个内存池存在。if (rv = apr_allocator_create(return rv;if (rv = apr_pool_create_ex(global_allocator = NULL;apr_pools_initialized = 0;return rv;apr_pool_tag(global_pool, “apr_global_pool“);(2)、“ 的分配子global_allocator，分配子global_allocator“ 内存池 global_pool，该内存池是所有的内存池的祖先。所有的内存池都从该内存池继而。在整个Apache的生存周期都存在，重启机器

35、，该内存池不。你把Apache彻底关闭。该内存池在中命名为“apr_gloabl_pool”。if (rv = apr_atomic_init(global_pool) != APR_SUCCESS) return rv;#if APR_HAS_THREADSapr_thread_mutex_t *mutex;if (rv = apr_thread_mutex_create(apr_allocator_mutex_set(global_allocator, mutex);#endif /* APR_HAS_THREADS */apr_allocator_owner_set(global

36、_allocator, global_pool);(3)、如前的作允许程，为fl 内存池” 程问的的程安，还必须设置apr_pool_t”内的锁变量mutex。最的任务是将内存分配子和内存池进行关联。Apache内存池内幕(5)2. .3内存池的“勿庸置疑，内存池的“是内存池的作之一。内存池“ 的型如下所示 APR C AR ap a u ap p c ea e ex ap p ewp ap p pa e ap ab uc ab ap a ca a ca 其中，ewp 是要“的的内存池，且“ 的内存池通过该。pa e 则是前“的内存池的父亲；ab “ 败的所的处理

37、；a ca 则是真进行内存分配的分配子。ap p p ap e e e ewp i !pa e pa e ba p i !ab pa e ab pa e - ab i a ca a ca pa e - a ca 在“过程中，我们没有定前“的内存池的父亲，则将其默认为父亲为内存池ba p ，如内存池关联的ab 和分配子a ca 没有定义，直继父辈的相关信息。i e a ca a c a ca A OC - APR O T S i ab ab APR O e u APR O e- ex e e- e e- ex p ap p e- i avai e- i avai p - e i av

38、ai cha p S Ocurrency1 POO T p - a ca a ca p - ac ive p - e e p - ab ab p - chi p - c eaup p - ee c eaup p - ubp ce e p - u e a a p - a 在一切绪之，将必须首先“ap p ”。但是前我们过Apache中对所有内存的分配都是以内存点ap e e 进行分配的，而且每分配的最小元为 K，这对于“ap p ” 不例外。因此将首先分配子a ca 分配 K的内存，将最顶端的内存分配ap e e ”。此着ap e e ”下的内存才能继续分配ap p ，

39、表示内存池”，ap p ”之才是真可的。在整个 K内存中，点头和内存池头部分别的大小为APR O T S 和S Ocurrency1 POO T，因此真可的实际上有 k- APR O T S -S Ocurrency1 POO T大小，至此我们还必须要整ap e e 中的 i avai 针和ap p ”中的 e i avai 针向真可。过轮分配之， K内存的如图3.所示一旦完内存池点的分配工作，我们必须将其挂内存池层树上。挂的过程是设置pa e ，chi 以及 ib i 的过程。i p - pa e pa e ! i p - ib i pa e - chi ! p

40、 - ib i - e p - ib i pa e - chi p p - e pa e - chi e e p - ib i p - e ewp p 挂的过程可以分为下个步骤 1、将前的点的pa e 针向父点，p - pa e pa e 。2、设定前点的 ibi 。 ibi 应该向与前点处于一层，且父点相的点，的点是插入子点链表的首部，插入通过下的实现 p - ib i pa e - chi pa e - chi p 不过如父点为，意着该点有兄弟点，故p - ib i 。3、设置 e 员。在ap p 中， e 于向在内存池点“的过程中，我们可以看，内存池“ ac i

41、ve 为。因此前内存池中能够的内存仅仅为 k- APR O T S -S Ocurrency1 POO T大小。如从内存池中请的内存的，，此必须通过ac ive 扩该内存池对应的内存点。这一点我们可以在内存池的内存分配中看出。Apache内存池内幕(6)2. . 内存池的内存分配从内存池中分配内存通过个实现 ap pca c和ap pa c，这个唯一的区别是ap pca c分配的内存部清，而ap pa c则这一步的工作。ap pa c的型如下所示 APR C AR v i ap pa c ap p p ap ize ize中p 是要分配内存的内存池， i

42、ze则是要分配的内存的大小。一旦分配则分配内存的地址。在解内存池的内存分配之前，我们应该对ac ive链表有所解。名义，ac ive链表中存的都是在的 ap e e 内存点。这点都是分配子进行分配，之所以，一个重要的因是们有足够闲的。将这点存在 ac ive上，这下要内存的要首先遍历ac ive链表可，有在ac ive链表中的点不能够足分配要求的才重分配子请的内存。一fi ，一旦某个点中进入ac ive链表，不能在先的分配子链表中存在。对于每一个ap e e 内存点，的实际可为e p- i avai 的大小。但是如前所，Apache中量

43、通常引的fi，对于所有的点，的闲ee i ex描述。为度，ac ive链表中的所有的点其的大小进行反向序，为此闲大得是在前，闲最小的则肯定在最末尾。对于定的分配，要将其与一个点的闲进行比较，如一个闲都不足，此必须向分配子重请，则直从一个点中分配，整分配的点序。ap e e ac ive e v i e ap ize ee i ex ize APR A currency1A T ize ac ive p - ac ive i ize ap ize ac ive- e p - ac ive- i avai e ac ive- i avai ac ive- i

44、avai ize e u e 分配首先要分配的实际，这都是对整过的。Apache首先尝试ac ive链表的一个点中分配，如前所言，这个是链表中闲最的点，如能够足要，Apache直 ize大小的，整的 i avai 针。不过这要注意的是对于链表的情况。一个内存池 ap c ea e p ex“以，的 ac ive链表为，不过此 ac ive不为，事实上ac ive e，意着ac ive向内存池所在的内存点。因此这种情况下，的分配不败。 e ac ive- ex i ize ap ize e- e p - e- i avai i e ve e e e i e a ca a c p - a ca ize i p - ab p - ab APR O e u 如 ac ive链表中的点都不能足分配求，此唯一能够的是直向分配子请的。至于分配子如何分配，是从池中获还是直 a c分配，此处不再。 e- ee i ex e e- i avai e- i avai ize i i e e ac

展开阅读全文