MySQL-Innodb-正常刷脏场景下FlushPages数量

作者: 多血 | 来源:发表于2020-10-05 22:39 被阅读0次

MySQL-Innodb-正常刷脏场景下FlushPages数量
MySQL-Innodb-批量刷脏的场景
MySQL-Innodb-刷脏的具体执行
MySQL-Innodb-Flush
常用命令
《武汉陈陈脏辫》全网最详细关于脏辫各类脏辫手法的制作区别
2018-04-26 规划
擦玻璃
物志 || 不新更要“脏”，脏出个性
spark--当分组遇到排序的解决思路

相关参数

innodb_max_dirty_pages_pct_lwm
innodb_max_dirty_pages_pct
innodb_adaptive_flushing
innodb_adaptive_flushing_lwm
innodb_flushing_avg_loops
innodb_io_capacity
innodb_io_capacity_max
先看一下要flush的page的数量是怎么计算出来的。
函数page_cleaner_flush_pages_recommendation。

    n_pages = (PCT_IO(pct_total) + avg_page_rate + pages_for_lsn) / 3;
     /* define PCT_IO(p) ((ulong) (srv_io_capacity * ((double) (p) / 100.0)))
    n_pages是要flush的目标数 */

以下四个参数影响pct_total的大小。

innodb_max_dirty_pages_pct_lwm
innodb_max_dirty_pages_pct
innodb_adaptive_flushing
innodb_adaptive_flushing_lwm

    pct_for_dirty = af_get_pct_for_dirty();
    pct_for_lsn = af_get_pct_for_lsn(age);
    pct_total = ut_max(pct_for_dirty, pct_for_lsn);

af_get_pct_for_dirty是根据脏页数计算比例，当innodb_max_dirty_pages_pct_lwm设置为0时，如果脏页比例大于srv_max_buf_pool_modified_pct时，pct_for_dirty设置为100。如果innodb_max_dirty_pages_pct_lwm设置不为0，如果脏页比大于srv_max_dirty_pages_pct_lwm，pct_for_dirty值为
(dirty_pct * 100)/( srv_max_buf_pool_modified_pct+1)。

/*********************************************************************//**
Calculates if flushing is required based on number of dirty pages in
the buffer pool.
@return percent of io_capacity to flush to manage dirty page ratio */
static
ulint
af_get_pct_for_dirty()
/*==================*/
{
    double  dirty_pct = buf_get_modified_ratio_pct();
    if (dirty_pct == 0.0) {
        /* No pages modified */
        return(0);
    }
    if (srv_max_dirty_pages_pct_lwm == 0) {
        /* The user has not set the option to preflush dirty
        pages as we approach the high water mark. */
        if (dirty_pct >= srv_max_buf_pool_modified_pct) {
            /* We have crossed the high water mark of dirty
            pages In this case we start flushing at 100% of
            innodb_io_capacity. */
            return(100);
        }
    } else if (dirty_pct >= srv_max_dirty_pages_pct_lwm) {
        /* We should start flushing pages gradually. */
        return(static_cast<ulint>((dirty_pct * 100)
               / (srv_max_buf_pool_modified_pct + 1)));
    }

    return(0);
}

af_get_pct_for_lsn是根据Redo的lsn计算比例，如果age>max_async_age(7/8log_get_capacity())或者开启了自适应且age>srv_adaptive_flushing_lwm log_get_capacity()，返回((srv_max_io_capacity / srv_io_capacity)* (lsn_age_factor * sqrt((double)lsn_age_factor)))/ 7.5))，否则返回0。

/*********************************************************************//**
Calculates if flushing is required based on redo generation rate.
@return percent of io_capacity to flush to manage redo space */
static
ulint
af_get_pct_for_lsn(
/*===============*/
    lsn_t   age)    /*!< in: current age of LSN. */
{
    lsn_t   max_async_age;
    lsn_t   lsn_age_factor;
    lsn_t   af_lwm = (srv_adaptive_flushing_lwm
              * log_get_capacity()) / 100;
    if (age < af_lwm) {
        /* No adaptive flushing. */
        return(0);
    }
    max_async_age = log_get_max_modified_age_async();
    if (age < max_async_age && !srv_adaptive_flushing) {
        /* We have still not reached the max_async point and
        the user has disabled adaptive flushing. */
        return(0);
    }
    /* If we are here then we know that either:
    1) User has enabled adaptive flushing
    2) User may have disabled adaptive flushing but we have reached
    max_async_age. */
    lsn_age_factor = (age * 100) / max_async_age;
    return(static_cast<ulint>(
        ((srv_max_io_capacity / srv_io_capacity)
        * (lsn_age_factor * sqrt((double)lsn_age_factor)))
        / 7.5));
}

以下参数影响着avg_page_rate与pages_for_lsn的计算。

innodb_flushing_avg_loops
innodb_flushing_avg_loops控制着avg_page_rate与lsn_avg_rate(表示每秒LSN推进的平均速率)的计算频率，值越大，avg_page_rate与lsn_avg_rate更新周期就越长，自适应flush对负载的响应就越不及时。

    sum_pages += last_pages_in; //last_pages_in:the number of pages flushed by the last flush_list flushing.
    ib_time_monotonic_t curr_time    = ut_time_monotonic();
    uint64_t            time_elapsed = curr_time - prev_time;
    const ulong             avg_loop     = srv_flushing_avg_loops;
    /* We update our variables every srv_flushing_avg_loops
    iterations to smooth out transition in workload. */
    if (++n_iterations >= avg_loop
        || time_elapsed >= (uint64_t)avg_loop) {
        if (time_elapsed < 1) {
            time_elapsed = 1;
        }
        avg_page_rate = static_cast<ulint>(
            ((static_cast<double>(sum_pages)
              / time_elapsed)
             + avg_page_rate) / 2);
        /* How much LSN we have generated since last call. */
        lsn_rate = static_cast<lsn_t>(
            static_cast<double>(cur_lsn - prev_lsn)
            / time_elapsed);
        lsn_avg_rate = (lsn_avg_rate + lsn_rate) / 2; 
        prev_lsn = cur_lsn;
        prev_time = curr_time;
        n_iterations = 0;
        sum_pages = 0;
    }

pages_for_lsn表示的是每个buffer pool 小于target_lsn的page数总和。
首先根据lsn_avg_rate计算target_lsn，然后遍历bp得到所有小于target_lsb的页的数量。

    oldest_lsn = buf_pool_get_oldest_modification();
    lsn_t   target_lsn = oldest_lsn
                 + lsn_avg_rate * buf_flush_lsn_scan_factor;
    for (ulint i = 0; i < srv_buf_pool_instances; i++) {
        buf_pool_t* buf_pool = buf_pool_from_array(i);
        ulint       pages_for_lsn = 0;
        buf_flush_list_mutex_enter(buf_pool);
        for (buf_page_t* b = UT_LIST_GET_LAST(buf_pool->flush_list);
             b != NULL;
             b = UT_LIST_GET_PREV(list, b)) {
            if (b->oldest_modification > target_lsn) {
                break;
            }
            ++pages_for_lsn;
        }
        buf_flush_list_mutex_exit(buf_pool);
        sum_pages_for_lsn += pages_for_lsn;
        mutex_enter(&page_cleaner->mutex);
        page_cleaner->slots[i].n_pages_requested
            = pages_for_lsn / buf_flush_lsn_scan_factor + 1;
        mutex_exit(&page_cleaner->mutex);
    }
    sum_pages_for_lsn /= buf_flush_lsn_scan_factor;
    if(sum_pages_for_lsn < 1) {
        sum_pages_for_lsn = 1;
    }
    /* Cap the maximum IO capacity that we are going to use by
    max_io_capacity. Limit the value to avoid too quick increase */
    ulint   pages_for_lsn =
        std::min<ulint>(sum_pages_for_lsn, srv_max_io_capacity * 2);

计算完总的n_pages以后还要根据redo log的空间以及bp脏页的分布情况考虑每个bp需要flush的页数。

    for (ulint i = 0; i < srv_buf_pool_instances; i++) {
        /* if REDO has enough of free space,
        don't care about age distribution of pages */
        page_cleaner->slots[i].n_pages_requested = pct_for_lsn > 30 ?
            page_cleaner->slots[i].n_pages_requested
            * n_pages / sum_pages_for_lsn + 1
            : n_pages / srv_buf_pool_instances;
    }

page_cleaner_flush_pages_recommendation完整代码

/*********************************************************************//**
This function is called approximately once every second by the
page_cleaner thread. Based on various factors it decides if there is a
need to do flushing.
@return number of pages recommended to be flushed
@param lsn_limit    pointer to return LSN up to which flushing must happen
@param last_pages_in    the number of pages flushed by the last flush_list
            flushing. */
static
ulint
page_cleaner_flush_pages_recommendation(
/*====================================*/
    lsn_t*  lsn_limit,
    ulint   last_pages_in)
{
    static  lsn_t       prev_lsn = 0;
    static  ulint       sum_pages = 0;
    static  ulint       avg_page_rate = 0;
    static  ulint       n_iterations = 0;
    static  ib_time_monotonic_t     prev_time;
    lsn_t           oldest_lsn;
    lsn_t           cur_lsn;
    lsn_t           age;
    lsn_t           lsn_rate;
    ulint           n_pages = 0;
    ulint           pct_for_dirty = 0;
    ulint           pct_for_lsn = 0;
    ulint           pct_total = 0;

    cur_lsn = log_get_lsn();

    if (prev_lsn == 0) {
        /* First time around. */
        prev_lsn = cur_lsn;
        prev_time = ut_time_monotonic();
        return(0);
    }

    if (prev_lsn == cur_lsn) {
        return(0);
    }

    sum_pages += last_pages_in;

    ib_time_monotonic_t curr_time    = ut_time_monotonic();
    uint64_t            time_elapsed = curr_time - prev_time;
    const ulong             avg_loop     = srv_flushing_avg_loops;

    /* We update our variables every srv_flushing_avg_loops
    iterations to smooth out transition in workload. */
    if (++n_iterations >= avg_loop
        || time_elapsed >= (uint64_t)avg_loop) {

        if (time_elapsed < 1) {
            time_elapsed = 1;
        }

        avg_page_rate = static_cast<ulint>(
            ((static_cast<double>(sum_pages)
              / time_elapsed)
             + avg_page_rate) / 2);

        /* How much LSN we have generated since last call. */
        lsn_rate = static_cast<lsn_t>(
            static_cast<double>(cur_lsn - prev_lsn)
            / time_elapsed);

        lsn_avg_rate = (lsn_avg_rate + lsn_rate) / 2; //这样做是为了让曲线平滑


        /* aggregate stats of all slots */
        mutex_enter(&page_cleaner->mutex);

        uint64_t  flush_tm = page_cleaner->flush_time;
        ulint   flush_pass = page_cleaner->flush_pass;

        page_cleaner->flush_time = 0;
        page_cleaner->flush_pass = 0;

        uint64_t lru_tm = 0;
        uint64_t list_tm = 0;
        ulint   lru_pass = 0;
        ulint   list_pass = 0;

        for (ulint i = 0; i < page_cleaner->n_slots; i++) {
            page_cleaner_slot_t*    slot;

            slot = &page_cleaner->slots[i];

            lru_tm    += slot->flush_lru_time;
            lru_pass  += slot->flush_lru_pass;
            list_tm   += slot->flush_list_time;
            list_pass += slot->flush_list_pass;

            slot->flush_lru_time  = 0;
            slot->flush_lru_pass  = 0;
            slot->flush_list_time = 0;
            slot->flush_list_pass = 0;
        }

        mutex_exit(&page_cleaner->mutex);

        /* minimum values are 1, to avoid dividing by zero. */
        if (lru_tm < 1) {
            lru_tm = 1;
        }
        if (list_tm < 1) {
            list_tm = 1;
        }
        if (flush_tm < 1) {
            flush_tm = 1;
        }

        if (lru_pass < 1) {
            lru_pass = 1;
        }
        if (list_pass < 1) {
            list_pass = 1;
        }
        if (flush_pass < 1) {
            flush_pass = 1;
        }

        MONITOR_SET(MONITOR_FLUSH_ADAPTIVE_AVG_TIME_SLOT,
                list_tm / list_pass);
        MONITOR_SET(MONITOR_LRU_BATCH_FLUSH_AVG_TIME_SLOT,
                lru_tm  / lru_pass);

        MONITOR_SET(MONITOR_FLUSH_ADAPTIVE_AVG_TIME_THREAD,
                list_tm / (srv_n_page_cleaners * flush_pass));
        MONITOR_SET(MONITOR_LRU_BATCH_FLUSH_AVG_TIME_THREAD,
                lru_tm / (srv_n_page_cleaners * flush_pass));
        MONITOR_SET(MONITOR_FLUSH_ADAPTIVE_AVG_TIME_EST,
                flush_tm * list_tm / flush_pass
                / (list_tm + lru_tm));
        MONITOR_SET(MONITOR_LRU_BATCH_FLUSH_AVG_TIME_EST,
                flush_tm * lru_tm / flush_pass
                / (list_tm + lru_tm));
        MONITOR_SET(MONITOR_FLUSH_AVG_TIME, flush_tm / flush_pass);

        MONITOR_SET(MONITOR_FLUSH_ADAPTIVE_AVG_PASS,
                list_pass / page_cleaner->n_slots);
        MONITOR_SET(MONITOR_LRU_BATCH_FLUSH_AVG_PASS,
                lru_pass / page_cleaner->n_slots);
        MONITOR_SET(MONITOR_FLUSH_AVG_PASS, flush_pass);

        prev_lsn = cur_lsn;
        prev_time = curr_time;

        n_iterations = 0;

        sum_pages = 0;
    }

    oldest_lsn = buf_pool_get_oldest_modification();

    ut_ad(oldest_lsn <= log_get_lsn());

    age = cur_lsn > oldest_lsn ? cur_lsn - oldest_lsn : 0;

    pct_for_dirty = af_get_pct_for_dirty();
    pct_for_lsn = af_get_pct_for_lsn(age);

    pct_total = ut_max(pct_for_dirty, pct_for_lsn);

    /* Estimate pages to be flushed for the lsn progress */
    ulint   sum_pages_for_lsn = 0;
    lsn_t   target_lsn = oldest_lsn
                 + lsn_avg_rate * buf_flush_lsn_scan_factor;

    for (ulint i = 0; i < srv_buf_pool_instances; i++) {
        buf_pool_t* buf_pool = buf_pool_from_array(i);
        ulint       pages_for_lsn = 0;

        buf_flush_list_mutex_enter(buf_pool);
        for (buf_page_t* b = UT_LIST_GET_LAST(buf_pool->flush_list);
             b != NULL;
             b = UT_LIST_GET_PREV(list, b)) {
            if (b->oldest_modification > target_lsn) {
                break;
            }
            ++pages_for_lsn;
        }
        buf_flush_list_mutex_exit(buf_pool);

        sum_pages_for_lsn += pages_for_lsn;

        mutex_enter(&page_cleaner->mutex);
        ut_ad(page_cleaner->slots[i].state
              == PAGE_CLEANER_STATE_NONE);
        page_cleaner->slots[i].n_pages_requested
            = pages_for_lsn / buf_flush_lsn_scan_factor + 1;
        mutex_exit(&page_cleaner->mutex);
    }

    sum_pages_for_lsn /= buf_flush_lsn_scan_factor;
    if(sum_pages_for_lsn < 1) {
        sum_pages_for_lsn = 1;
    }

    /* Cap the maximum IO capacity that we are going to use by
    max_io_capacity. Limit the value to avoid too quick increase */
    ulint   pages_for_lsn =
        std::min<ulint>(sum_pages_for_lsn, srv_max_io_capacity * 2);

    n_pages = (PCT_IO(pct_total) + avg_page_rate + pages_for_lsn) / 3;

    if (n_pages > srv_max_io_capacity) {
        n_pages = srv_max_io_capacity;
    }

    /* Normalize request for each instance */
    mutex_enter(&page_cleaner->mutex);
    ut_ad(page_cleaner->n_slots_requested == 0);
    ut_ad(page_cleaner->n_slots_flushing == 0);
    ut_ad(page_cleaner->n_slots_finished == 0);

    for (ulint i = 0; i < srv_buf_pool_instances; i++) {
        /* if REDO has enough of free space,
        don't care about age distribution of pages */
        page_cleaner->slots[i].n_pages_requested = pct_for_lsn > 30 ?
            page_cleaner->slots[i].n_pages_requested
            * n_pages / sum_pages_for_lsn + 1
            : n_pages / srv_buf_pool_instances;
    }
    mutex_exit(&page_cleaner->mutex);

    MONITOR_SET(MONITOR_FLUSH_N_TO_FLUSH_REQUESTED, n_pages);

    MONITOR_SET(MONITOR_FLUSH_N_TO_FLUSH_BY_AGE, sum_pages_for_lsn);

    MONITOR_SET(MONITOR_FLUSH_AVG_PAGE_RATE, avg_page_rate);
    MONITOR_SET(MONITOR_FLUSH_LSN_AVG_RATE, lsn_avg_rate);
    MONITOR_SET(MONITOR_FLUSH_PCT_FOR_DIRTY, pct_for_dirty);
    MONITOR_SET(MONITOR_FLUSH_PCT_FOR_LSN, pct_for_lsn);

    *lsn_limit = LSN_MAX;

    return(n_pages);
}

http://mysql.taobao.org/monthly/2015/03/02/
http://www.leviathan.vip/2020/05/19/mysql-understand-adaptive-flushing/

MySQL-Innodb-正常刷脏场景下FlushPages数量
相关参数 innodb_max_dirty_pages_pct_lwm innodb_max_dirty_page...
MySQL-Innodb-批量刷脏的场景
buf_flush_page_cleaner_coordinator协调线程的主循环主线程以最多1s的间隔或者收到...
MySQL-Innodb-刷脏的具体执行
参数 innodb_lru_scan_depth调用栈批量刷脏会从lru和flush list中flush。inn...
MySQL-Innodb-Flush
刷脏的种类批量刷脏单页刷脏操作批量刷脏是后台线程发起，单页刷脏操作是用户线程发起。批量刷脏中的同步刷脏是Red...
常用命令
LRU列表可用页数量缓冲池脏页数量达到90%时，强制刷新脏页磁盘每秒IO Full purge回收undo页数量
《武汉陈陈脏辫》全网最详细关于脏辫各类脏辫手法的制作区别
你是否刷抖音看到脏辫，刷快手看到脏辫，刷b站看到脏辫，刷小红书看到脏辫以及诸多等等平台又或者电视综艺节目看到脏辫...
2018-04-26 规划
1拿配钥匙的机器 2洗衣服、刷鞋（然后把脏鞋拿到136刷） 3拿床单被罩（如果有脏的要洗一下） 4上线淘宝BVIP...
擦玻璃
今天我刷过玻璃了！我刷玻璃的原因是，妈妈把玻璃擦好了之后。外婆又用抹布擦了一下，所以更脏啦，更脏的原因是，水珠的痕...
物志 || 不新更要“脏”，脏出个性
知女范微信公众平台：zhinvfan 近期又是暴雨、又是回南天的，鞋子又湿又脏的。鞋脏了可以刷、刷不干净可以换，脏...
spark--当分组遇到排序的解决思路
场景现在有如下数据格式图书分类，图书名，数量现在想统计全部分类中数量最多的书名以及数量场景解析如果不基于...