mysql

作者: Leonzai | 来源:发表于2018-07-24 22:57 被阅读45次

表的优化

  1. 定长和变长分离
  2. 核心与常用的字段,建议定长。
  3. 不常用的,如用户介绍,需要点击头像才能获取,可以变长,放其他表。
  4. 适当加入冗余字段,比如主题内的帖子数。

列选择原则

  1. 列选择优先级:整型、date、time、enum、char、varchar、blob、text
解释:
同样是一个字节 tinyint 和 char(1) ,选择 tinyint ,因为它不需要判断字符集,校对集(排序规则)。
time 定长,运算快,省空间。需要考虑时区。
enum:起到约束作用。内部用整型存储。
text 和 blob:无法使用内存临时表,所以排序等操作只能再磁盘上运行。

date 和 time 选择:大师明确意见,请用 unsigned int not null

举例:utf 8 情况下
tinyint()           1个字节
enum(‘男’, ‘女’)内部由数值存储,有个转化过程
char(1)3个字节
  1. 够用就行,不要慷慨。
如:
age:tinyint unsigned (0 - 255)
varchar(20)  设置为 varchar(300) 关联表时候,占更多内存。
  1. 避免用 null ,查询不便。
查询使用 is null ,is not null

b-tree 索引和 hash 索引

42 亿数据,普通查找,需要 21 亿次,b-tree 只要 32 次肯定找到。
myisam,innodb 默认 b-tree 索引。
memory 引擎用的 hash 索引。

hash 索引坏处:

  1. 不利于范围查询,
  2. 随机放置会有残余空间
  3. 无法利用前缀索引,btree 搜索 helloworld 中的 hello 也是能利用到索引的。
  4. 不利于排序。
  5. Hash 索引遇到大量 Hash 值相等的情况后性能并不一定就会比 B-Tree 索引高
  6. 需要回表

b-tree 常见误区

不是常用的列都要加上索引
     where user_id=1 and time>14564564564
     user_id 和 time 都加上索引
     这两个索引只会用到其中一个。
     解决方案:联合索引,无论使用其中哪个,索引都会起到作用。但是要满足左前缀。
image.png
下图,c1,c2,c3,c4 均为 tinyint
image.png

explain 只显示索引在查询时用了多少索引,group 和 order 不会显示。但是 group order 也会用到索引。
group 在高版本的 sql 里面,你 group by c2,c3 那么只能 select c2 或者 c3 或者 arvg()等,不能有 c4 或其他的。


image.png image.png

聚簇索引和非聚簇索引

myisam 分为:(假设是 user 表)
users.frm   结构
users.MYD  数据
users.MYI  索引
  1. mysiam 是非聚簇索引,MYD 和 MYI 分开。
  2. innodb 是聚簇索引,数据和索引挤在一起,无需回表。
  3. 无规律的数据插入 innnodb 会造成频繁页分裂,导致速度慢,但是在固态和内存中是随机写入。速度差异就不明显了。


    image.png

索引覆盖

要查询的字段和搜索的字段都在索引上


image.png
image.png
image.png
image.png

理想索引

  1. 查询频繁
  2. 区分度高 (性别字段属于区分度低,很低)
  3. 长度小
  4. 尽量能够覆盖到常用查询字段。

举例:中国常用短语

区分度
select ( (select count(distinct left(word,2)) from dictory) / (select count(*) from dictory) )
image.png

如何解决左前缀区分度低的字段查询

例如:http://baidu.com, http://qq.com

  1. 倒序插入数据库
  2. 伪 hash 索引,增加一个字段,存储之为 crc32(url)

多列索引原则

考虑因素:1. 列查询频度 2. 列的区分度 3. 列的顺序。 根本:按业务情景区分。


image.png

索引和排序

image.png

如果是 索引回行,索引回行。。。在回行时候将费时间,因为磁盘操作。
order by 要用索引,否则耗性能。

不能有重复索引,可多建冗余索引

index(user_id, phone_id)index(user_id) // 重复索引
index(user_id, phone_id)index(phone_id, user_id) // 冗余索引

索引碎片与修复

alter table t engine myisam;
optimize  table exam;

优化查询

查的快 联合索引顺序,区分度,长度
取得快 索引覆盖
传的少 只取出需要的数据


image.png

1.sql语句执行的时间:等待时间,执行时间
2.优化执行时间:查找时间 取出时间
3.优化大思路:不查->少查->高效的查

explain

id:查询语句的id
select_type: 简单查询:simple  复合查询:subquery(非from子查询) ,derived(from型子查询), (union, union result:结果的那次)
table:查询的表,derived(from子查询的表),null
type:搜索的数据范围:
    ALL(全表扫描)<
    index(全索引扫描)<
    range(范围索引查找)<
    ref(通过索引列,可以直接饮用某些数据行)<eq_ref(通过索引列,引用某一行数据)<
    const system null 精准查询
pssible_keys:可能使用的key
key:使用的key
key_len:使用的key长度
ref:连接查询时,表之间的字段引用关系
rows:可能扫描的行数
Extra:描述
    using filesort:文件排序<
    using temporary:使用了临时表<
    using where:使用索引还不能完全定位,还需要where判断一下<
    index:使用到了索引覆盖
image.png

六. 其他注意

1.in型子查询:in其实是每一个数据的一次exists查询

2.强制使用索引:using index XXX

3.count()
4.union:最好使用union all

5.翻页优化:
尽量将limit 10000,10这样的优化成 where id>10000 limit 10
业务上少翻页
先索引覆盖查找主键,再连接需要的字段


image.png

MySQL的缓存是基于整个SQL语句的,只要SQL语句中任何一点发生变化,那么整个语句就不会被缓存。复杂的语句,重复出现的概率可能很低。所以,适当的拆分,有可能提高整体的缓存命中率。

相关文章

网友评论

      本文标题:mysql

      本文链接:https://www.haomeiwen.com/subject/cwxumftx.html