延迟加载解决mysql offset过大导致的分页性能问题

作者: throwsterY | 来源:发表于2017-04-09 13:49 被阅读215次

延迟加载解决mysql offset过大导致的分页性能问题
mysql orcal分页区别
复习3
mysql查询优化
解决SD加载过多过大图片导致内存爆表崩溃的问题
8. sharding-jdbc源码之结果合并总结
Mybatis延迟加载及二级缓存简明教程
mysql sql优化之 limit 分页优化
头发一天天的掉，你知道MySQL的Limit有性能问题吗？
mysql深度分页优化

当我们展示一个列表中的内容时，难免会遇到分页问题，因为列表中的内容数量可能很多，但是用户能一次看到的界面大小是有限的，不可能一个界面展示所有的内容，从后端一次性取太多的数据也会给后端造成额外的压力。

一般来说，存储在Mysql中的数据我们有两种分页方式：基于id的分页和基于offset的分页。

下面以我在实际生产环境中遇到的一个sql为例，相关字段因为保密问题均用A、B、C......代替。

SELECT
  *
FROM
  table_A USE INDEX (index_A)
WHERE
  A = xxx
  AND B = xxx
  AND C IN (xxx)
ORDER BY
  D DESC
LIMIT
  33380, 11

KEY `index_A` (`A`,`B`,`D`,`C`)

mysql使用offset分页的时候会首先去二级索引(index_A)中找出满足条件的offset＋limit行记录的id，然后根据id去聚簇索引中找到对应的行记录，取出offset+limit行数据，最后丢掉offset行，只保留limit行，这样效率在offset很大的时候很差，因为去聚簇索引中访问了太多不必要的数据。

上面这个语句的执行时间大概是8s，而id分页和上面有什么不同呢？id分页就是每次去后端请求数据时，带上前一页最后一个id，这样的话我们在去mysql捞数据的时候where条件里加上一个id>last_id，limit 33380, 11换成limit 11，按照id来order_by。这样可以少去聚簇索引中拿很多数据。上面的例子就可以少拿3w多条，只拿需要的11条。

id分页的限制？
id分页往往需要在产品上做一些妥协，因为如果每次拿数据都是基于上一页最后一个id的话，我们就无法进行指定页的跳转，例如直接跳到第5页等等，加载数据的时候使用的是更多按钮。

如果上述sql所在服务改成id分页的话需要改产品分页设计，前端可能也要调整，改动会大一点。有一种延迟加载的方式，可以解决offset过大导致的分页性能问题。

我们将上述例子中的sql拆成两句：

1.
SELECT
  table_A.id
FROM
  table_A USE INDEX (index_A)
WHERE
  A = xxx
  AND B = xxx
  AND C IN (xxx)
ORDER BY
  D DESC
LIMIT
  33380, 11;

2.
Select ＊ from table_A where id in (ids)

两个查询加起来时间大概50ms，相比之前的8s，快了很多，原因如下：

第一个查询会走覆盖索引，因为所有查询的列都在二级索引(index_A)中，不用去访问聚簇索引中的数据行，这样效率是很快的，我们可以拿到我们需要的11个记录的id，之后第二个sql根据id去聚簇索引中拿数据也很快。