美文网首页
sql面试题:topN问题

sql面试题:topN问题

作者: Mr_摩根 | 来源:发表于2020-02-10 22:48 被阅读0次

    工作中会经常遇到这样的业务问题:

    如何找到每个类别下用户最喜欢的产品是哪个?

    如果找到每个类别下用户点击最多的5个商品是什么?

    这类问题其实就是常见的:分组取每组最大值、最小值,每组最大的N条(top N)记录。

    面对该类问题,如何解决呢?

    下面我们通过成绩表的例子来给出答案。

    成绩表是学生的成绩,里面有学号(学生的学号),课程号(学生选修课程的课程号),成绩(学生选修该课程取得的成绩)

    分组取每组最大值

    案例:按课程号分组取成绩最大值所在行的数据

    我们可以使用分组(group by)和汇总函数得到每个组里的一个值(最大值,最小值,平均值等)。但是无法得到成绩最大值所在行的数据。

    select课程号,max(成绩)as最大成绩fromscoregroupby课程号;

    我们可以使用关联子查询来实现:

    select*fromscoreasawhere成绩 = (selectmax(成绩)fromscoreasbwhereb.课程号 = a.课程号);

    上面查询结果课程号“0001”有2行数据,是因为最大成绩80有2个

    分组取每组最小值

    案例:按课程号分组取成绩最小值所在行的数据

    同样的使用关联子查询来实现

    select*fromscoreasawhere成绩 = (selectmin(成绩)fromscoreasbwhereb.课程号 = a.课程号);

    如果不懂什么是关联子查询,可以看下我讲过的《从零学会SQL》的“复杂查询”

    每组最大的N条记录

    案例:查询各科成绩前两名的记录

    第1步,查出有哪些组

    我们可以按课程号分组,查询出有哪些组,对应这个问题里就是有哪些课程号

    select课程号,max(成绩)as最大成绩fromscoregroupby课程号;

    第2步:先使用order by子句按成绩降序排序(desc),然后使用limt子句返回topN(对应这个问题返回的成绩前两名)

    -- 课程号'0001' 这一组里成绩前2名select*fromscorewhere课程号 ='0001'orderby成绩desclimit2;

    同样的,可以写出其他组的(其他课程号)取出成绩前2名的sql

    第3步,使用union all 将每组选出的数据合并到一起

    -- 左右滑动可以可拿到全部sql(select*fromscorewhere课程号 ='0001'orderby成绩desclimit2)unionall(select*fromscorewhere课程号 ='0002'orderby成绩desclimit2)unionall(select*fromscorewhere课程号 ='0003'orderby成绩desclimit2);

    前面我们使用order by子句按某个列降序排序(desc)得到的是每组最大的N个记录。如果想要达到每组最小的N个记录,将order by子句按某个列升序排序(asc)即可。

    求topN的问题还可以使用自定义变量来实现,这个在后续再介绍。

    如果对多表合并还不了解的,可以看下我讲过的《从零学会SQL》的“多表查询”。

    总结

    今天学习了常见面试题:分组取每组最大值、最小值,每组最大的N条(top N)记录。

    后面遇到类似的题目,你都可以用文中的sql语句来解决了。

    转载自https://mp.weixin.qq.com/s/MuxjlFV0gi1GydOrYfiSeQ

    相关文章

      网友评论

          本文标题:sql面试题:topN问题

          本文链接:https://www.haomeiwen.com/subject/sdzzxhtx.html