美文网首页
innodb中count(*),count(字段),count(

innodb中count(*),count(字段),count(

作者: 森林中大鸟 | 来源:发表于2020-06-26 12:08 被阅读0次

    count(参数)函数解释

    count() 是一个聚合函数,对于返回的结果集,一行一行的判断,函数参数不是NULL时累计值就加1,否则不加,最后返回累计值。
    没有过滤条件时,myisam中把一个表的总数存在磁盘上,执行count(*)直接返回这个数,效率很高。innodb中需要把数据一行一行的从引擎中读出来,然后累计。

    count()各种用法对比

    根据函数解释可以知道,count(*),count(1),count(主键id)都表示满足条件的总行数,而count(字段)表示满足条件的总行数里面参数 “字段” 不为NULL的总个数。

    • count(主键id)
      innodb会遍历整张表,把每一行的id取出来,返回给server层,server层拿到id后,判断不可能为NULL,就按行累加。

    • count(1)
      innodb会遍历整张表,但不取值,server层对于返回的每一行,放一个数字1进去,判断不可能为NULL,按行累加。

    • count(字段)

    1. 如果字段定义为not null,一行行的从记录中读出这个字段,判断不可能为空,按行累加。
    2. 如果字段定义允许为null, 执行时需要先把值取出来进行判断,判断不是null才累加。
    • count(*)
      不会把字段全部取出来,而是专门做了优化,不取值,因为肯定不是null,直接按行累加。
    操作 是否取值 是否判断 备注
    count(*) 最快
    count(1)
    count(主键id) 可能使用最小的索引树
    count(字段) 字段上无索引时,只能选主键索引

    效率对比

    count(字段)< count(主键id) < count(1)≈count(*)

    为什么innodb中没有把表记录总数存储起来?

    因为即使同一时刻的多个查询,多版本并发控制(MVCC)的原因,表中总记录数是不确定的,各个事务中得到的结果可能也不一样。

    比如在可重复读的隔离级别下,每一行记录要判断这个记录对这个会话是否可见,因此对count(*)请求来说,innodb只好把数据一行一行读出并做出判断,可见的行才能用于当前查询。

    MySQL如何对count(*) 操作的优化的?

    由于innodb中主键索引树的叶子节点是数据,普通索引树的叶子节点是主键值,因此普通索引比主键索引小很多。对于conut(*)遍历那个索引树得到的结果逻辑上都是一样的,因此MySQL优化器会找到最小的那个树去遍历。

    在保证逻辑正确的前提下, 尽量减少数据的扫描,是数据库设计的通用法则之一。

    show table status输出的总行数TABLE_ROWS 能替代count(*)吗?

    不能。TABLE_ROWS是通过采样估算出来的,因此这个值很不准确。官方文档描述误差可达到40%-50%

    相关文章

      网友评论

          本文标题:innodb中count(*),count(字段),count(

          本文链接:https://www.haomeiwen.com/subject/wgoyfktx.html