美文网首页
SQL 优化的那些事

SQL 优化的那些事

作者: Loofer | 来源:发表于2018-09-05 09:50 被阅读0次

    优化手段

    • 创建索引:创建合适的索引,我们就可以现在索引中查询,查询到以后直接找对应的记录。
    • 分表 :当一张表的数据比较多或者一张表的某些字段的值比较多并且很少使用时,采用水平分表和垂直分表来优化
    • 读写分离:当一台服务器不能满足需求时,采用读写分离的方式进行集群。
    • 缓存:使用redis来进行缓存

    查找慢查询并定位慢查询

    在项目自验项目转测试之前,在启动mysql数据库时开启慢查询,并且把执行慢的语句写到日志中,在运行一定时间后。通过查看日志找到慢查询语句。

    要找出项目中的慢 SQL 时
    1、关闭数据库服务器(关闭服务)
    2、把慢查询记录到日志中



    3、设置慢查询时间



    4、找出日志中的慢查询 SQL
    使用explain 慢查询语句,来详细分析语句的问题.

    选择合适的存储引擎

    在开发中,我们经常使用的存储引擎

    myisam / innodb/ memory

    MyISAM存储引擎

    如果表对事务要求不高,同时是以查询和添加为主的,我们考虑使用myisam存储引擎. 比如 bbs 中的 发帖表,回复表.

    INNODB存储引擎:

    对事务要求高,保存的数据都是重要数据,我们建议使用INNODB,比如订单表,账号表.

    Memory 存储

    我们数据变化频繁,不需要入库,同时又频繁的查询和修改,我们考虑使用memory, 速度极快.

    MyISAM 和 INNODB的区别(主要)

    1. 事务安全 MyISAM 不支持事务而 innodb 支持
    2. 查询和添加速度 MyISAM 不用支持事务就不用考虑同步锁,查找和添加和添加的速度快
    3. 支持全文索引 MyISAM 支持 INNODB 不支持
    4. 锁机制 MyISAM 支持表锁而 INNODB支持行锁(事务)
    5. 外键 MyISAM 不支持外键, INNODB支持外键. (通常不设置外键,通常是在程序中保证数据的一致)


    数据库优化之创建合适的索引

    索引(Index)是帮助DBMS高效获取数据的数据结构。
    分类:普通索引/唯一索引/主键索引/全文索引
    普通索引:允许重复的值出现
    唯一索引:除了不能有重复的记录外,其它和普通索引一样(用户名、用户身份证、email,tel)
    主键索引:是随着设定主键而创建的,也就是把某个列设为主键的时候,数据库就会給改列创建索引。这就是主键索引.唯一且没有null值
    全文索引:用来对表中的文本域(char,varchar,text)进行索引, 全文索引针对MyIsam
    explain select * from articles where match(title,body) against(‘database’);【会使用全文索引】

    索引使用小技巧

    索引弊端

    1.占用磁盘空间。
    2.对dml(插入、修改、删除)操作有影响,变慢。

    使用场景:

    a: 肯定在where条件经常使用,如果不做查询就没有意义
    b: 该字段的内容不是唯一的几个值(sex)
    c: 字段内容不是频繁变化.

    具体技巧:

      1. 对于创建的多列索引(复合索引),不是使用的第一部分就不会使用索引。
        alter table dept add index my_ind (dname,loc); // dname 左边的列,loc就是右边的列
    explain select * from dept where dname='aaa'\G 会使用到索引
    explain select * from dept where loc='aaa'\G 就不会使用到索引
    
      1. 对于使用like的查询,查询如果是’%aaa’不会使用到索引而‘aaa%’会使用到索引。
       explain select * from dept where dname like '%aaa'\G不能使用索引
       explain select * from dept where dname like 'aaa%'\G使用索引.
    

    所以在like查询时,‘关键字’的最前面不能使用 % 或者 _这样的字符.,如果一定要前面有变化的值,则考虑使用 全文索引->sphinx.

      1. 如果条件中有or,有条件没有使用索引,即使其中有条件带索引也不会使用。换言之,就是要求使用的所有字段,都必须单独使用时能使用索引.
      1. 如果列类型是字符串,那一定要在条件中将数据使用引号引用起来。否则不使用索引。
    expain select * from dept where dname=’111’;
    expain select * from dept where dname=111;(数值自动转字符串)
    expain select * from dept where dname=qqq;报错
    

    也就是,如果列是字符串类型,无论是不是字符串数字就一定要用 ‘’ 把它包括起来.

      1. 如果mysql估计使用全表扫描要比使用索引快,则不使用索引。
        表里面只有一条记录

    数据库优化之分表

    分表分为水平(按行)分表垂直(按列)分表

    根据经验,MySQL 表数据一般达到百万级别,查询效率会很低,容易造成表锁,甚至堆积很多连接,直接挂掉;水平分表能够很大程度较少这些压力。
    按行数据进行分表。

    如果一张表中某个字段值非常多(长文本、二进制等),而且只有在很少的情况下会查询。这时候就可以把字段多个单独放到一个表,通过外键关联起来。
    考试详情,一般我们只关注分数,不关注详情。
    水平分表策略:
    1.按时间分表
    这种分表方式有一定的局限性,当数据有较强的实效性,如微博发送记录、微信消息记录等,这种数据很少有用户会查询几个月前的数据,如就可以按月分表。
    2.按区间范围分表
    一般在有严格的自增id需求上,如按照user_id水平分表:
    table_1 user_id从1~100w
    table_2 user_id从101~200w
    table_3 user_id从201~300w
    3.hash分表*****
    通过一个原始目标的ID或者名称通过一定的hash算法计算出数据存储表的表名,然后访问相应的表。

    语句优化小技巧

    DDL优化:

    1 、通过禁用索引来提供导入数据性能 。 这个操作主要针对有数据库的表,追加数据

    //去除键
    alter table test3 DISABLE keys;
    //批量插入数据
    insert into test3 select * from test;
    //恢复键
    alter table test3 ENABLE keys;
    

    2、 关闭唯一校验

    set unique_checks=0  关闭
    set unique_checks=1  开启
    

    3、修改事务提交方式(导入)(变多次提交为一次)

    set autocommit=0   关闭
    //批量插入
    set autocommit=1   开启
    

    DML优化(变多次提交为一次)

    insert into test values(1,2);
    insert into test values(1,3);
    insert into test values(1,4);
    //合并多条为一条
    insert into test values(1,2),(1,3),(1,4)
    

    DQL优化

    Order by优化

    1、多用索引排序
    2、普通结果排序(非索引排序)Filesort

    group by优化

    使用 order by null,取消默认排序

    子查询优化

    在客户列表找到不在支付列表的客户
    在客户列表找到不在“支付列表”的客户 , 查询没买过东西的客户

    explain
    select * from customer where customer_id not in (select DISTINCT customer_id from payment); #子查询      -- 这种是基于func外链
    
    explain 
    select * from customer c left join payment p on(c.customer_id=p.customer_id) where p.customer_id is null   
    -- 这种是基于“索引”外链
    

    Or优化

    在两个独立索引上使用or的性能优于
    1、 or两边都是用索引字段做判断,性能好
    2、 or两边,有一边不用,性能差
    3、 如果employee表的name和email这两列是一个复合索引,但是如果是 :name='A' OR email='B' 这种方式,不会用到索引!
    (or以上实际验证,错误!!)

    limit优化

    select film_id,description from film order by title limit 50,5;
    
    select a.film_id,a.description from film a inner join (select film_id from film order by title limit 50,5)b on a.film_id=b.film_id
    

    jdbc批量插入几百万数据怎么实现

    1、变多次提交为一次
    3、使用批量操作


    MySQL 行转列、字段合并、列转行

    https://blog.csdn.net/yifanSJ/article/details/74279110

    使用 INSERT INTO ... SELECT 语法

    通过 INSERT INTO ... SELECT 语法,我们可以把 SELECT 的结果集直接写入另一张表中,而不需要程序处理。通过这个语法,外加一些变通,我们可以很方便的实现更多的需求场景。

    比如说,我们要给所有购买了某一商品的用户发放一张元价值10元的优惠券,我们可以这样写:

        insert into tickets (user_id, price, expires_in)
        select
        user_id, 10 as price, '2017-09-09' as expires_in
        from orders
        where product_id=123 and is_paid=1;
    

    又比如说,在选课的场景中,我们要给一批人分配一批课,假设要给1班的人分配体育课和美术课,我们可以通过该语法加 CROSS JOIN 实现:

    insert into class_members (class_id, user_id, status)
    select
    c.id as class_id,
    u.id as user_id,
    1 as status
    from classes as c cross join users as u
    where c.name in ('体育课', '美术课') and u.class_name='1班';
    

    30条MySQL查询的优化方法

    https://www.awaimai.com/526.html

    26条MySQL性能优化的最佳经验

    https://www.awaimai.com/569.html

    相关文章

      网友评论

          本文标题:SQL 优化的那些事

          本文链接:https://www.haomeiwen.com/subject/ipbowftx.html