美文网首页
MySQL调优实战之性能剖析,调优中的基础

MySQL调优实战之性能剖析,调优中的基础

作者: javap | 来源:发表于2020-02-09 13:29 被阅读0次

    性能优化:减少或者消除那些对获得查询结果来说不必要的工作

    程序性能瓶颈可能有很多因素:
    ①、外部资源,比如调用了外部的WEB服务或者搜索引擎。
    ②、应用需要处理大量的数据,比如分析一个超大的XML文件。
    ③、在循环中执行昂贵的操作,比如滥用正则表达式。
    ④、使用了低效率算法等。

    对MySQL查询进行性能剖析有两种方式:

    1.剖析整个数据库服务器,这样可以分析出哪些查询是主要的压力来源。
    2.定位具体需要优化的查询后,可以对这些查询进行单独的剖析,分析哪些子任务是影响时间的主要消耗者。

    慢查询日志

    #是否开启慢查询日志,1/on表示开启,0/off表示关闭。
    show VARIABLES like 'slow_query_log';
    #未使用索引的查询也被记录到慢查询日志中,on表示开启,off表示关闭(默认值)。
    show VARIABLES like 'log_queries_not_using_indexes';
    #慢查询阈值(秒级),当查询时间大于设定的阈值时,记录日志。
    show VARIABLES like 'long_query_time';
    #慢查询日志存储路径
    show variables like 'slow_query_log_file';
    set global slow_query_log = on;
    set global log_queries_not_using_indexes = on;
    set global long_query_time = 0;
    

    pt-query-digest

    第一部分:总体统计结果
    • Exec time:执行时间
    • Lock time:锁定时间
    • Rows sent:发送行数
    • Rows examine:扫描行数
    • Query size:查询字符数
    第二部分:查询分组统计结果
    • Rank:所有语句的排名,默认按查询时间降序排列,通过--order-by指定
    • Query ID:语句的ID,(去掉空格和查询条件中的文本值,计算hash值)
    • Response:总的响应时间
    • time:该查询在本次分析中总的时间占比
    • calls:执行次数,即本次分析总共有多少条这种类型的查询语句
    • R/Call:平均每次执行的响应时间
    • V/M:方差均值比(Variance-to-mean),也就是常说的离差指数。
    • Item:查询对象
    第三部分:每一种查询的详细统计结果

    查询各项数据的百分比、总数、最小、最大、平均、95%等各项目的统计,包括SQL执行次数、执行时间、锁占用时间、发送行数、扫描行数、查询字符数,表格中也统计了查询涉及的数据库、查询时间直方图等信息。



    扫描的行数(Rows Examine)远远大于发送的行数(Rows sent) , 有问题, 需要优化, 索引利用差
    Query_time distribution:查询时间分布图——————直方图

    哪些SQL需要优化:

    1.查询次数多,且每次查询占用时间长的SQL:通常为pt-query-digest分析的前几个查询
    2.IO大的SQL:注意pt-query-digest分析中的Rows examine
    3.未使用索引的SQL:通过pt-query-digest分析中的Rows examine与Rows Send对比

    剖析单条查询

    使用SHOW PROFILE

    #开启:
    SET profiling = 1;
    #查看开启工具后的每条SQL执行总体情况
    SHOW PROFILES;
    #根据query_id查看某个查询的详细时间耗费
    SHOW PROFILE FOR QUERY 1;
    #查看cpu、IO等信息
    SHOW PROFILE BLOCK IO,CPU FOR QUERY 1;
    #对每一个子任务的花费时间进行已统计排序
    SELECT state, SUM(duration) AS Total_R, 
      ROUND(100 * SUM(duration) / (SELECT SUM(duration) FROM information_schema.profiling WHERE query_id = 1), 2) AS Pct_R, 
      COUNT(*) as Calls, SUM(duration) /COUNT(*) AS "R/Call" 
      FROM information_schema.profiling
    WHERE query_id = 1 GROUP BY state ORDER BY total_r DESC;
    
    • Creating sort index:当前的SELECT中需要用到临时表在进行ORDER BY排序。建议:创建适当的索引
    • Sending data:发送数据
    • table lock:表锁。
    • System lock:系统锁。建议确认是由于哪个锁引起的,通常是因为MySQL或InnoDB内核级的锁引起的
    • Sorting result:结果的排序
    • copying to tmp table:将数据复制到临时表
    • Creating tmp table:创建临时表
    执行计划:Explain
    • table:对应的表
    • type:连接类型(system、const、eq_ref、ref、range、index、all)
    • possible_keys:可能使用的索引
    • key:实际使用的索引
    • key_len:使用索引长度
    • rows:预计扫描行数
    • Extra:解析查询的额外信息(using index、using where、using temporary、using filesort)
    连接类型(type)
    #all  全表扫描
    explain select * from address;
    #index 全索引扫描
    explain select city_id from address;
    #range   < >    in()  between   根据索引范围查找
    explain select * from address where city_id>2;
    #ref  根据索引 查询匹配某个值的行
    explain select * from address where city_id=200;
    #eq_ref
    explain select a.* from store a INNER JOIN address b using(address_id) where b.address='47 MySakila Drive';
    #const
    explain select * from address where address_id=1;
    
    MySQL解析额外信息(Extra)

    1、Using index:列数据仅仅使用了索引中的信息而没有读取实际的表
    Select address_id from address where address_id=1
    2、Using where:MySQL服务器将在存储引擎检索行后,通过Where子句条件进行过滤
    Select * from address where city_id>12;
    3、Using temporary:MYSQL需要创建一个临时表来存储结果,用于排序
    Select DISTINCT district from address;
    4、Using filesort:MySQL将对结果进行外部排序
    Select * from address order by district;

    MySQL执行计划的局限
    • EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
    • EXPLAIN不考虑各种Cache
    • EXPLAIN不能显示MySQL在执行查询时所作的优化工作
      部分统计信息是估算的,并非精确值
    • EXPALIN只能解释SELECT操作,其他操作要重写为SELECT后查看执行计划
    • LooseScan:利用索引来扫描一个子查询表,可以从每个子查询的值群组中选出一个单一的值。

    相关文章

      网友评论

          本文标题:MySQL调优实战之性能剖析,调优中的基础

          本文链接:https://www.haomeiwen.com/subject/ocigxhtx.html