修补DBA短板：监控SQL优化案例两则

作者: rewq123 | 来源:发表于2018-06-28 14:28 被阅读12次

修补DBA短板：监控SQL优化案例两则
修补DBA短板：监控SQL优化案例两则
自制小工具大大加速MySQL SQL语句优化(附源码)
BATJ解决千万级别数据之MySQL 的 SQL 优化大总结
详解MySQL之SQL优化（1）
故障分析 | MySQL clone 自动重启失败的解决方式
技术分享 | MGR 单主模式组内滚动升级
故障分析 | MySQL Server 端为什么有大量的TCP
sql优化案例
技术分享 | MySQL 并行 DDL

一、表空间信息查询慢

前几天跟销售拜访潜在客户时，客户提到他们近期很头疼的问题：他们自己写的一个查询表空间的语句从上周开始跑不出来了，做了很多尝试未果，比较苦恼，毕竟作为DBA不知道库的空间使用情况，客户心里是有点发毛的。

听完客户描述，我也马上回复说这个问题很常见，都在我们日常巡检的范围内，解决起来很简单。一般查询表空间的语句都是用到了DBA_FREE_SPACE这张视图，查询起来慢，常见原因一般如下：

数据字典信息/固化视图统计信息过旧；

回收栈内对象过多。

处理方式：

exec dmbs_stats.gather_fixed_objects_stats;

exec dbms_stats.gather_dictionary_stats(degree =>8,cascade =>true);

purge recyclebin;

客户听完介绍的解决方案，表示认同并希望现场帮他们处理好问题，热情地带我去他的工位。虽然库并非生产数据库，但访问这个库依然需要通过堡垒机，而且命令需要手敲。

客户的演示

客户通过shell脚本SQLplus进入数据库后运行语句类似以下SQL：

SELECT UPPER(F.TABLESPACE_NAME) AS "表空间名称",

ROUND(D.AVAILB_BYTES ,2) AS "表空间大小(G)",

ROUND(D.MAX_BYTES,2) AS "最终表空间大小(G)",

ROUND((D.AVAILB_BYTES - F.USED_BYTES),2) AS "已使用空间(G)",

TO_CHAR(ROUND((D.AVAILB_BYTES - F.USED_BYTES) / D.AVAILB_BYTES * 100,

2), '999.99') AS "使用比",

ROUND(F.USED_BYTES, 6) AS "空闲空间(G)",

F.MAX_BYTES AS "最大块(M)"

FROM (

SELECT TABLESPACE_NAME,

ROUND(SUM(BYTES) / (1024 * 1024 * 1024), 6) USED_BYTES,

ROUND(MAX(BYTES) / (1024 * 1024 * 1024), 6) MAX_BYTES

FROM SYS.DBA_FREE_SPACE

GROUP BY TABLESPACE_NAME) F,

(SELECT DD.TABLESPACE_NAME,

ROUND(SUM(DD.BYTES) / (1024 * 1024 * 1024), 6) AVAILB_BYTES,

ROUND(SUM(DECODE(DD.MAXBYTES, 0, DD.BYTES, DD.MAXBYTES))/(1024*1024*1024),6) MAX_BYTES

FROM SYS.DBA_DATA_FILES DD

GROUP BY DD.TABLESPACE_NAME) D

WHERE D.TABLESPACE_NAME = F.TABLESPACE_NAME

ORDER BY 4 DESC

客户运行了脚本，果然卡住了一样，无返回结果。演示完，客户让出了座位，示意我可以上机操作了。因为不是生产库，客户也表示可以随意操作，于是没有去进一步确认信息，顺利完成了上面列的操作。

有趣的地方来了

客户开始验证效果的时候，比较尴尬，依然卡在那儿。客户地方没有监控，也没有我习惯的脚本，客户打开plSQLdeveloper后，我看了一下在运行的SQL等待事件是单块儿读，我有点犹豫要不要手敲那些工具SQL的时候，有趣的地方也来了~ 客户的DBA开始讨论起了原因：

一个客户DBA说，他觉得是IO太慢，因为库不是放在存储上的，而且raid可能用的是raid 5之类。

另一个客户DBA说，可能是数据库太大了，性能有影响。

为了避免问题走偏，我快速打了个快照，做了awr报告，确认了一下单块读约3ms，数据文件个数约800个。证伪了以上假设。

那到底为什么SQL查询还是不快呢？我有点犹豫，毕竟堡垒机命令都手敲不能直接跑自己的脚本包。客户主要负责的DBA此时主动给台阶让我下，让我找时间再看看，回去了再研究，毕竟他们也快下班了。

意外的效果

这个台阶当然不能下…… 在10046跟moitor报告中，个人还是更倾向monitor报告，于是脚本加了monitor的hint，打算再跑一次。另外一个会话准备编写脚本的时候，SQL瞬间出了结果。常用脚本这里也贴一下：

set pagesize 0 echo off timing off linesize 1000 trimspool on trim on long 2000000 longchunksize 2000000 feeDBAck off

spool &1..&2

--active/html/EM

select dbms_SQLtune.report_SQL_monitor(type=>'&2', SQL_id=>'&1', SQL_exec_id=>null, report_level=>'ALL') monitor_report from dual;

spool off

客户DBA说这个hint有效果，但是我也不打算糊弄客户，跟客户解释了这个hint跟跑起来快了没什么关系，并用 /*+ xxx */这个改动，再次运行，果然也很快。客户运行原来的语句，依然跑不出来。这时候，基本已经知道原因了。

虽然讲道理，收集了统计，SQL的执行计划应该是会失效，并重新解析的，这里显然那个SQL的执行计划应该还是原来的，没有变动。考虑到不是生产库，就直接flush了shared pool。再次运行那个问题SQL，顺利秒出结果。

二、ASH信息采集慢

某客户反馈监控上线后，在监控的数十套数据库中有一套库监控SQL的数据库时间占比较高，监控自身显示是一条采集ASH数据的语句。经过了解，其他库该语句执行均在1s以内，在其中一个数据库上运行时间可达4分钟，监控中我们马上发现了该SQL的监视报告。

监视报告快速定位

打开报告，通过Wait Activity中可发现55%时间是read by other session等待事件，还有36%为gc相关等待事件，结合2GB的IO，可以基本可知问题原因为SQL读取IO量过多，在RAC高并发环境下，性能问题被放大

阅读全文请点击http://click.aliyun.com/m/1000003871/

网友评论

本文标题：修补DBA短板：监控SQL优化案例两则

本文链接：https://www.haomeiwen.com/subject/fxmgyftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

修补DBA短板：监控SQL优化案例两则

相关文章