当我们展示一个列表中的内容时,难免会遇到分页问题,因为列表中的内容数量可能很多,但是用户能一次看到的界面大小是有限的,不可能一个界面展示所有的内容,从后端一次性取太多的数据也会给后端造成额外的压力。
一般来说,存储在Mysql中的数据我们有两种分页方式:基于id的分页和基于offset的分页。
下面以我在实际生产环境中遇到的一个sql为例,相关字段因为保密问题均用A、B、C......代替。
SELECT
*
FROM
table_A USE INDEX (index_A)
WHERE
A = xxx
AND B = xxx
AND C IN (xxx)
ORDER BY
D DESC
LIMIT
33380, 11
KEY `index_A` (`A`,`B`,`D`,`C`)
mysql使用offset分页的时候会首先去二级索引(index_A)中找出满足条件的offset+limit行记录的id,然后根据id去聚簇索引中找到对应的行记录,取出offset+limit行数据,最后丢掉offset行,只保留limit行,这样效率在offset很大的时候很差,因为去聚簇索引中访问了太多不必要的数据。
上面这个语句的执行时间大概是8s,而id分页和上面有什么不同呢?id分页就是每次去后端请求数据时,带上前一页最后一个id,这样的话我们在去mysql捞数据的时候where条件里加上一个id>last_id,limit 33380, 11换成limit 11,按照id来order_by。这样可以少去聚簇索引中拿很多数据。上面的例子就可以少拿3w多条,只拿需要的11条。
id分页的限制?
id分页往往需要在产品上做一些妥协,因为如果每次拿数据都是基于上一页最后一个id的话,我们就无法进行指定页的跳转,例如直接跳到第5页等等,加载数据的时候使用的是更多按钮。
如果上述sql所在服务改成id分页的话需要改产品分页设计,前端可能也要调整,改动会大一点。有一种延迟加载的方式,可以解决offset过大导致的分页性能问题。
我们将上述例子中的sql拆成两句:
1.
SELECT
table_A.id
FROM
table_A USE INDEX (index_A)
WHERE
A = xxx
AND B = xxx
AND C IN (xxx)
ORDER BY
D DESC
LIMIT
33380, 11;
2.
Select * from table_A where id in (ids)
两个查询加起来时间大概50ms,相比之前的8s,快了很多,原因如下:
第一个查询会走覆盖索引,因为所有查询的列都在二级索引(index_A)中,不用去访问聚簇索引中的数据行,这样效率是很快的,我们可以拿到我们需要的11个记录的id,之后第二个sql根据id去聚簇索引中拿数据也很快。
网友评论