memcache（三）内存管理

浏览数：28 / 时间：2015年06月20日

memcached（三）内存管理

memcached使用预申请的方式来管理内存的分配，从而避免内存碎片化的问题。如果采用mallo和free来动态的申请和销毁内存，必然会产生大量的内存碎片。

基本知识

slab：内存块是memcached一次申请内存的最小单元，在memcached中一个slab的默认大小为1M；

slabclass：特定大小的chunk的组。

chunk：缓存的内存空间，一个slab被划分为若干个chunk；

item：存储数据的最小单元，每一个chunk都会包含一个item；

factor:增长因子，默认为1.25，相邻slab中的item大小与factor成比例关系；

基本原理

memcached使用预分配方法，避免频繁的调用malloc和free；

memcached通过不同的slab来管理不同chunk大小的内存块，从而满足存储不同大小的数据。

slab的申请是通过在使用item时申请slab大小的内存空间，然后再把内存切割为大小相同的item，挂在到slab的未使用链表上。

过期和被删除item并不会被free掉，memcached并不会删除已经分配的内存；

Memcached会优先使用已超时的记录空间，通过LRU算法；

memcached使用lazy expiration来判断元素是否过期，所以过期监视上不会占用cpu时间。

源码分析

下面主要分析memcached的内存申请和存储相关代码。

item

item是key/value的存储单元。

typedef struct _stritem {
    struct _stritem *next;      /* 前后指针用于在链表slab->slots中连接前后数据 */
    struct _stritem *prev;
    struct _stritem *h_next;    /* hash chain next */
    rel_time_t      time;       /* 最后一次访问时间 */
    rel_time_t      exptime;    /* 过期时间 */
    int             nbytes;     /* 数据大小 */
    unsigned short  refcount;   /* 引用次数 */
    uint8_t         nsuffix;    /* suffix长度 */
    uint8_t         it_flags;   /* ITEM_* above */
    uint8_t         slabs_clsid;/* 所有slab的id */
    uint8_t         nkey;       /* key长度 */
    /* this odd type prevents type-punning issues when we do
     * the little shuffle to save space when not using CAS. */
    union {
        uint64_t cas;
        char end;
    } data[]; /* cas|key|suffix|value */
} item;

slab初始化

void slabs_init(const size_t limit, const double factor, const bool prealloc) {
    int i = POWER_SMALLEST - 1;
    unsigned int size = sizeof(item) + settings.chunk_size; /* 得到每一个item的大小 */

    mem_limit = limit;

    if (prealloc) { /* 预分配一块内存 */
        ...
    }

    memset(slabclass, 0, sizeof(slabclass)); /* 把slabclass置为0，slabclass是一个slab数组，存储所有slab的信息 */

    while (++i < POWER_LARGEST && size <= settings.item_size_max / factor) {  /* 循环初始化每一个slab的内容,保证slab中item的size小于max_size/factor */
        /* Make sure items are always n-byte aligned */
        if (size % CHUNK_ALIGN_BYTES)  /* 用于内存对齐 */
            size += CHUNK_ALIGN_BYTES - (size % CHUNK_ALIGN_BYTES);

        slabclass[i].size = size; /* 初始化slabclass中item的大小 */
        slabclass[i].perslab = settings.item_size_max / slabclass[i].size; /* 初始化每个slab中item的数量 */
        size *= factor;  /* item的大小随factor逐渐增大 */
        ...
    }
    /* 初始化最后一个slab,大小为最大的max_size，只有一个item */
    power_largest = i;
    slabclass[power_largest].size = settings.item_size_max;
    slabclass[power_largest].perslab = 1;
    ...
}

从源码中，可以看出来同一个slab中所有的item的大小都是固定的，

申请slab内存

static void *do_slabs_alloc(const size_t size, unsigned int id) {
    slabclass_t *p;
    void *ret = NULL;
    item *it = NULL;

    if (id < POWER_SMALLEST || id > power_largest) { /* 判断id是否合法 */
        MEMCACHED_SLABS_ALLOCATE_FAILED(size, 0);
        return NULL;
    }

    p = &slabclass[id]; /* 获取slab */
    assert(p->sl_curr == 0 || ((item *)p->slots)->slabs_clsid == 0);

    /* fail unless we have space at the end of a recently allocated page,
       we have something on our freelist, or we could allocate a new page */
    if (! (p->sl_curr != 0 || do_slabs_newslab(id) != 0)) { /*如果sl_curr为0，没有剩余的item，那么就执行do_slabs_newslab申请内存空间*/
        /* We don‘t have more memory available */
        ret = NULL;
    } else if (p->sl_curr != 0) { /* 如果有未使用的空间，则获取该item，并从slots链表中删除该item */
        /* return off our freelist */
        it = (item *)p->slots;
        p->slots = it->next;
        if (it->next) it->next->prev = 0;
        p->sl_curr--;
        ret = (void *)it;
    }
    ...
    return ret;
}

sl_curr来判断是否存在未使用的内容空间，如果不存在需要调用do_slabs_newslab来申请slab空间。

static int do_slabs_newslab(const unsigned int id) {
    slabclass_t *p = &slabclass[id];
    int len = settings.slab_reassign ? settings.item_size_max
        : p->size * p->perslab;
    char *ptr;
    /* 1. 判断是否超过内存限制
         2. 判断是否申请过内存空间
         3. 如果没有申请过，则申请slab->size*slab->perslab大小的整块内存
         4.如果申请过，调用grow_slab_list来扩大slab大小 */
    if ((mem_limit && mem_malloced + len > mem_limit && p->slabs > 0) ||
        (grow_slab_list(id) == 0) ||
        ((ptr = memory_allocate((size_t)len)) == 0)) {

        MEMCACHED_SLABS_SLABCLASS_ALLOCATE_FAILED(id);
        return 0;
    }

    memset(ptr, 0, (size_t)len);
    split_slab_page_into_freelist(ptr, id); /* 把申请的内存分配到slots链表中 */

    p->slab_list[p->slabs++] = ptr;
    mem_malloced += len;
    MEMCACHED_SLABS_SLABCLASS_ALLOCATE(id);

    return 1;
}

申请空间后，需要通过split_slab_page_into_freelist函数把申请的内存空间分配到未使用的链表中。

static void split_slab_page_into_freelist(char *ptr, const unsigned int id) {
    slabclass_t *p = &slabclass[id];
    int x;
    for (x = 0; x < p->perslab; x++) { /* 循环分配内存 */
        do_slabs_free(ptr, 0, id);
        ptr += p->size;
    }
}

static void do_slabs_free(void *ptr, const size_t size, unsigned int id) {
    slabclass_t *p;
    item *it;
    ...
    p = &slabclass[id];
    /* 获取内存指针，把item块挂在到slots链表中，增加sl_curr */
    it = (item *)ptr;
    it->it_flags |= ITEM_SLABBED;
    it->prev = 0;
    it->next = p->slots;
    if (it->next) it->next->prev = it;
    p->slots = it;

    p->sl_curr++;
    p->requested -= size;
    return;
}

获取适当大小的item

在do_item_alloc中，调用了slabs_clsid来获取适合存储当前元素的slab id。

unsigned int slabs_clsid(const size_t size) {
    int res = POWER_SMALLEST;

    if (size == 0)
        return 0;
    while (size > slabclass[res].size)    /* 遍历slabclass来找到适合size的item */
        if (res++ == power_largest)     /* won‘t fit in the biggest slab */
            return 0;
    return res;
}