memcache(三)内存管理

memcached(三)内存管理

memcached使用预申请的方式来管理内存的分配,从而避免内存碎片化的问题。如果采用mallo和free来动态的申请和销毁内存,必然会产生大量的内存碎片。

基本知识

slab:内存块是memcached一次申请内存的最小单元,在memcached中一个slab的默认大小为1M;

slabclass:特定大小的chunk的组。

chunk:缓存的内存空间,一个slab被划分为若干个chunk;

item:存储数据的最小单元,每一个chunk都会包含一个item;

factor:增长因子,默认为1.25,相邻slab中的item大小与factor成比例关系;

基本原理

memcached使用预分配方法,避免频繁的调用malloc和free;

memcached通过不同的slab来管理不同chunk大小的内存块,从而满足存储不同大小的数据。

slab的申请是通过在使用item时申请slab大小的内存空间,然后再把内存切割为大小相同的item,挂在到slab的未使用链表上。

过期和被删除item并不会被free掉,memcached并不会删除已经分配的内存;

Memcached会优先使用已超时的记录空间,通过LRU算法;

memcached使用lazy expiration来判断元素是否过期,所以过期监视上不会占用cpu时间。

源码分析

下面主要分析memcached的内存申请和存储相关代码。

item

item是key/value的存储单元。

typedef struct _stritem {
    struct _stritem *next;      /* 前后指针用于在链表slab->slots中连接前后数据 */
    struct _stritem *prev;
    struct _stritem *h_next;    /* hash chain next */
    rel_time_t      time;       /* 最后一次访问时间 */
    rel_time_t      exptime;    /* 过期时间 */
    int             nbytes;     /* 数据大小 */
    unsigned short  refcount;   /* 引用次数 */
    uint8_t         nsuffix;    /* suffix长度 */
    uint8_t         it_flags;   /* ITEM_* above */
    uint8_t         slabs_clsid;/* 所有slab的id */
    uint8_t         nkey;       /* key长度 */
    /* this odd type prevents type-punning issues when we do
     * the little shuffle to save space when not using CAS. */
    union {
        uint64_t cas;
        char end;
    } data[]; /* cas|key|suffix|value */
} item;

slab初始化

void slabs_init(const size_t limit, const double factor, const bool prealloc) {
    int i = POWER_SMALLEST - 1;
    unsigned int size = sizeof(item) + settings.chunk_size; /* 得到每一个item的大小 */

    mem_limit = limit;

    if (prealloc) { /* 预分配一块内存 */
        ...
    }

    memset(slabclass, 0, sizeof(slabclass)); /* 把slabclass置为0,slabclass是一个slab数组,存储所有slab的信息 */

    while (++i < POWER_LARGEST && size <= settings.item_size_max / factor) {  /* 循环初始化每一个slab的内容,保证slab中item的size小于max_size/factor */
        /* Make sure items are always n-byte aligned */
        if (size % CHUNK_ALIGN_BYTES)  /* 用于内存对齐 */
            size += CHUNK_ALIGN_BYTES - (size % CHUNK_ALIGN_BYTES);

        slabclass[i].size = size; /* 初始化slabclass中item的大小 */
        slabclass[i].perslab = settings.item_size_max / slabclass[i].size; /* 初始化每个slab中item的数量 */
        size *= factor;  /* item的大小随factor逐渐增大 */
        ...
    }
    /* 初始化最后一个slab,大小为最大的max_size,只有一个item */
    power_largest = i;
    slabclass[power_largest].size = settings.item_size_max;
    slabclass[power_largest].perslab = 1;
    ...
}

从源码中,可以看出来同一个slab中所有的item的大小都是固定的,

申请slab内存

static void *do_slabs_alloc(const size_t size, unsigned int id) {
    slabclass_t *p;
    void *ret = NULL;
    item *it = NULL;

    if (id < POWER_SMALLEST || id > power_largest) { /* 判断id是否合法 */
        MEMCACHED_SLABS_ALLOCATE_FAILED(size, 0);
        return NULL;
    }

    p = &slabclass[id]; /* 获取slab */
    assert(p->sl_curr == 0 || ((item *)p->slots)->slabs_clsid == 0);

    /* fail unless we have space at the end of a recently allocated page,
       we have something on our freelist, or we could allocate a new page */
    if (! (p->sl_curr != 0 || do_slabs_newslab(id) != 0)) { /*如果sl_curr为0,没有剩余的item,那么就执行do_slabs_newslab申请内存空间*/
        /* We don‘t have more memory available */
        ret = NULL;
    } else if (p->sl_curr != 0) { /* 如果有未使用的空间,则获取该item,并从slots链表中删除该item */
        /* return off our freelist */
        it = (item *)p->slots;
        p->slots = it->next;
        if (it->next) it->next->prev = 0;
        p->sl_curr--;
        ret = (void *)it;
    }
    ...
    return ret;
}

sl_curr来判断是否存在未使用的内容空间,如果不存在需要调用do_slabs_newslab来申请slab空间。

static int do_slabs_newslab(const unsigned int id) {
    slabclass_t *p = &slabclass[id];
    int len = settings.slab_reassign ? settings.item_size_max
        : p->size * p->perslab;
    char *ptr;
    /* 1. 判断是否超过内存限制
         2. 判断是否申请过内存空间
         3. 如果没有申请过,则申请slab->size*slab->perslab大小的整块内存
         4.如果申请过,调用grow_slab_list来扩大slab大小 */
    if ((mem_limit && mem_malloced + len > mem_limit && p->slabs > 0) ||
        (grow_slab_list(id) == 0) ||
        ((ptr = memory_allocate((size_t)len)) == 0)) {

        MEMCACHED_SLABS_SLABCLASS_ALLOCATE_FAILED(id);
        return 0;
    }

    memset(ptr, 0, (size_t)len);
    split_slab_page_into_freelist(ptr, id); /* 把申请的内存分配到slots链表中 */

    p->slab_list[p->slabs++] = ptr;
    mem_malloced += len;
    MEMCACHED_SLABS_SLABCLASS_ALLOCATE(id);

    return 1;
}

申请空间后,需要通过split_slab_page_into_freelist函数把申请的内存空间分配到未使用的链表中。

static void split_slab_page_into_freelist(char *ptr, const unsigned int id) {
    slabclass_t *p = &slabclass[id];
    int x;
    for (x = 0; x < p->perslab; x++) { /* 循环分配内存 */
        do_slabs_free(ptr, 0, id);
        ptr += p->size;
    }
}

static void do_slabs_free(void *ptr, const size_t size, unsigned int id) {
    slabclass_t *p;
    item *it;
    ...
    p = &slabclass[id];
    /* 获取内存指针,把item块挂在到slots链表中,增加sl_curr */
    it = (item *)ptr;
    it->it_flags |= ITEM_SLABBED;
    it->prev = 0;
    it->next = p->slots;
    if (it->next) it->next->prev = it;
    p->slots = it;

    p->sl_curr++;
    p->requested -= size;
    return;
}

获取适当大小的item

在do_item_alloc中,调用了slabs_clsid来获取适合存储当前元素的slab id。

unsigned int slabs_clsid(const size_t size) {
    int res = POWER_SMALLEST;

    if (size == 0)
        return 0;
    while (size > slabclass[res].size)    /* 遍历slabclass来找到适合size的item */
        if (res++ == power_largest)     /* won‘t fit in the biggest slab */
            return 0;
    return res;
}

优缺点

内存预分配可以避免内存碎片以及避免动态分配造成的开销。

内存分配是由冗余的,当一个slab不能被它所拥有的chunk大小整除时,slab尾部剩余的空间就会被丢弃。

由于分配的是特定长度的内存,因此无法有效地利用所有分配的内存,例如如果将100字节的数据存储在128字节的chunk中,会造成28字节的浪费。

 

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。