美文网首页
Mysql 数据库优化

Mysql 数据库优化

作者: Mr_dreamer | 来源:发表于2018-03-02 14:43 被阅读15次

文章转载自segmentfault 踏雪无痕S 的回答 ,加上个人的一些观点 侵删

设计原则

1、不在数据库做运算:cpu计算务必移至业务层
2、控制单表数据量:单表记录控制在1000w
3、控制列数量:字段数控制在20以内
4、平衡范式与冗余:为提高效率牺牲范式设计,冗余数据
5、拒绝3B:拒绝大sql,大事务,大批量
6、表字符集使用UTF8
7、使用INNODB存储引擎

关于 使用 INNODB 存储引擎,在《高性能Mysql》这本书中就有提到,不建议使用MyIsam,具体请查阅此书

数据表设计

1、尽可能地使用最有效(最小)的数据类型

tinyint(1Byte)
smallint(2Byte)
mediumint(3Byte)
int(4Byte)
bigint(8Byte)
bad case:int(1)/int(11)
2、不要将数字存储为字符串,字符转化为数字,用int存储ip而非char(15)

对于PHP 可以用 long2ip() 和ip2long() 函数对IP进行转换

3、优先使用enum或set,sex enum (‘F’, ‘M’)
4,避免使用NULL字段

NULL字段很难查询优化
NULL字段的索引需要额外空间
NULL字段的复合索引无效
bad case:name char(32) default nullage int not null
good case:age int not null default 0
5,少用text/blob,varchar的性能会比text高很多;实在避免不了blob,请拆表

6、不在数据库里存图片

7、对于MyISAM表,如果没有任何变长列(VARCHAR、TEXT或BLOB列),使用固定尺寸的记录格式。这比较快但是不幸地可能会浪费一些空间。即使你已经用CREATE选项让VARCHAR列ROW_FORMAT=fixed,也可以提示想使用固定长度的行

8、使用sample character set,例如latin1。尽量少使用utf-8,因为utf-8占用的空间是latin1的3倍。可以在不需要使用utf-8的字段上面使用latin1,例如mail,url等

以前没有注意过这一点。。。

9、精确度与空间的转换。在存储相同数值范围的数据时,浮点数类型通常都会比DECIMAL类型使用更少的空间。FLOAT字段使用4 字节存储 数据。DOUBLE类型需要8 个字节并拥有更高的精确度和更大的数值范围,DECIMAL类型的数据将会转换成DOUBLE类型

10、库名表名字段名必须有固定的命名长度,12个字符以内;库名、表名、字段名禁止超过32个字符。须见名之意;库名、表名、字段名禁止使用MySQL保留字;临时库、表名必须以tmp为前缀,并以日期为后缀; 备份库、表必须以bak为前缀,并以日期为后缀

11、InnoDB表行记录物理长度不超过8KB,InnoDB的data page默认是16KB,基于B+Tree的特点,一个data page中需要至少存储2条记录。因此,当实际存储长度超过8KB(尤其是TEXT/BLOB列)的大列(large column)时会引起“page-overflow存储”,类似ORACLE中的“行迁移”,因此,如果必须使用大列(尤其是TEXT/BLOB类型)且读写频繁的话,则最好把这些列拆分到子表中,不要和主表放在一起存储,如果不太频繁,可以考虑继续保留在主表中,如果将 innodbpagesize 选项修改成 8KB,那么行记录物理长度建议不超过4KB

索引类

1、谨慎合理使用索引

改善查询、减慢更新
索引一定不是越多越好(能不加就不加,要加的一定得加)
覆盖记录条数过多不适合建索引,例如“性别”
2、字符字段必须建前缀索引

3、不在索引做列运算,bad case:select id where age +1 = 10;

没记错的话再索引列计算就不会使用索引, 大小比较也算计算

4、innodb主键推荐使用自增列

主键建立聚簇索引
主键不应该被修改
字符串不应该做主键
如果不指定主键,innodb会使用唯一且非空值索引代替
5、不用外键,请由程序保证约束

6、避免在已有索引的前缀上建立索引。例如:如果存在index(a,b)则去掉index(a)

7、控制单个索引的长度。使用key(name(8))在数据的前面几个字符建立索引

8、要选择性的使用索引。在变化很少的列上使用索引并不是很好,例如性别列

9、Optimize table可以压缩和排序index,注意不要频繁运行

10、Analyze table可以更新数据

11、索引选择性是不重复的索引值也叫基数(cardinality)表中数据行数的比值,索引选择性=基数/数据行,count(distinct(username))/count(*) 就是索引选择性,高索引选择性的好处就是mysql查找匹配的时候可以过滤更多的行,唯一索引的选择性最佳,值为1

12、不要用重复或多余索引,对于INNODB引擎的索引来说,每次修改数据都要把主键索引,辅助索引中相应索引值修改,这可能会出现大量数 据迁移,分页,以及碎片的出现

13、超过20个长度的字符串列,最好创建前缀索引而非整列索引(例如:ALTER TABLE t1 ADD INDEX(user(20))),可以有效提高索引利用率,不过它的缺点是对这个列排序时用不到前缀索引。前缀索引的长度可以基于对该字段的统计得出, 一般略大于平均长度一点就可以了

14、定期用 pt-duplicate-key-checker 工具检查并删除重复的索引。比如 index idx1(a, b) 索引已经涵盖了 index idx2(a),就可以删除 idx2 索引了

sql语句设计类

1、sql语句尽可能简单,一条sql只能在一个cpu运算,大语句拆小语句,减少锁时间,一条大sql可以堵死整个库(充分利用QUERY CACHE和充分利用多核CPU)

2、简单的事务,事务时间尽可能短,bad case:上传图片事务

3、避免使用trig/func,触发器、函数不用,客户端程序取而代之

4、不用select *,消耗cpu,io,内存,带宽,这种程序不具有扩展性

5、OR改写为IN()

or的效率是n级别
in的消息时log(n)级别
in的个数建议控制在200以内
select id from t where phone=’159′ or phone=’136′ =>select id from t where phone in (’159′, ’136′);
6、OR改写为UNION

mysql的索引合并很弱智
select id from t where phone = '159' or name = 'john';
=>
select id from t where phone='159' union select id from t where name='jonh';
7、避免负向%,如not in/like

8、慎用count(*)

这句不是很赞同,因为和count(1)相比起来并没有什么明显的差距,但是好像都比count(主键)好。这部分内容《高性能Mysql》这本书中好像也有提到

9、limit高效分页

limit越大,效率越低
select id from t limit 10000, 10;
=>
select id from t where id > 10000 limit 10;

可以使用 延迟关联 优化 limit

10、使用union all替代union,union有去重开销

11、少用连接join

通过反范式,增加重复数据列来避免使用join

12、使用group by,分组、自动排序

13、请使用同类型比较

14、使用load data导数据,load data比insert快约20倍

15、对数据的更新要打散后批量更新,不要一次更新太多数据

16、使用性能分析工具

Sql explain / showprofile / mysqlsla

说来惨愧 我只用过 explain

17、使用--log-slow-queries –long-query-time=2查看查询比较慢的语句。然后使用explain分析查询,做出优化

show profile;
mysqlsla;
mysqldumpslow;
explain;
show slow log;
show processlist;
show query_response_time(percona)
optimize 数据在插入,更新,删除的时候难免一些数据迁移,分页,之后就出现一些碎片,久而久之碎片积累起来影响性能, 这就需要DBA定期的优化数据库减少碎片,这就通过optimize命令。如对MyISAM表操作:optimize table 表名

18、禁止在数据库中跑大查询

19、使预编译语句,只传参数,比传递SQL语句更高效;一次解析,多次使用;降低SQL注入概率

20、禁止使用order by rand()

21、禁止单条SQL语句同时更新多个表

我猜问题在于 行锁和某一个表更新失败数据不可逆问题

22、避免在数据库中进行数学运算(MySQL不擅长数学运算和逻辑判断)

23、SQL语句要求所有研发,SQL关键字全部是大写,每个词只允许有一个空格

24、能不用NOT IN就不用NOTIN,坑太多了。。会把空和NULL给查出来

注意
1、哪怕是基于索引的条件过滤,如果优化器意识到总共需要扫描的数据量超过30%时(ORACLE里貌似是20%,MySQL目前是30%,没准以后会调整),就会直接改变执行计划为全表扫描,不再使用索引

2、多表JOIN时,要把过滤性最大(不一定是数据量最小哦,而是只加了WHERE条件后过滤性最大的那个)的表选为驱动表。此外,如果JOIN之后有排序,排序字段一定要属于驱动表,才能利用驱动表上的索引完成排序

3、绝大多数情况下,排序的代价通常要来的更高,因此如果看到执行计划中有 Using filesort,优先创建排序索引吧

4、利用 pt-query-digest 定期分析slow query log,并结合 Box Anemometer 构建slow query log分析及优化系统

最后 《高性能Mysql》这本书真的非常推荐,虽然小弟好多看不懂的内容

相关文章

  • MySQL数据库与SQL优化

    一、MySQL数据库 - SQL优化 MySQL DBMS - MySQL Database Management...

  • MySQL-性能优化-优化设计和设计原则

    MySQL-性能优化-优化设计和设计原则 MySQL性能优化目的 如何合理的设计数据库? 什么样的数据库设计才能给...

  • MySQL5:性能优化

    性能优化 优化MySQL数据库是数据库管理员和数据库开发人员的必备技能。MySQL优化,一方面是找出系统的瓶颈,提...

  • SQL审核优化建议

    SQL审核优化建议 数据库类型 MySQL:RDS MySQL、PolarDB MySQL、MariaDB、Pol...

  • 数据库存储原理特性索引优化

    说一下mysql数据库存储的原理? 事务的特性? 数据库索引 数据库怎么优化查询效率? 数据库优化方案 优化索引、...

  • MySQL优化

    概述 MySQL优化分为三部分优化: MySQL服务器和配置优化 数据库设计和结构优化 查询优化(重点) MySQ...

  • mysql性能与优化

    数据库结构优化 数据库结构设计 mysql复制

  • MySQL书目

    MySQL数据库索引设计与优化 MySQL技术内幕 MySQL排错指南 高性能MySQL MySQL DBA修炼之道

  • zabbix4.0 之mysql优化(Zabbix分区表)

    zabbix最大的瓶颈不在zabbix服务,而是mysql数据库的压力上,优化mysql其实就是优化zabbix的...

  • 性能优化系列文章目录

    1.概览 性能优化概览 2.MySQL数据库优化 如何做好MySQL数据库优化-第一部分 快速生成百万级测试数据 ...

网友评论

      本文标题:Mysql 数据库优化

      本文链接:https://www.haomeiwen.com/subject/vvjaxftx.html