1.定义数据库和实例
两个概念:
数据库(database):物理操作系统文件或其他形式文件类型的集合。在MySQL数据库中,数据库文件可以是frm、MYD、MYI、ibd结尾的文件。当使用NDB引擎时,数据库的文件可能不是操作系统上的文件,而是存放于内存之中的文件,但是定义仍然不变。
实例(instance):MySQL数据库由后台线程以及一个共享内存区组成。共享内存可以被运行的后台线程所共享。需要牢记的是,数据库实例才是真正用于操作数据库文件的。
在MySQL数据库中,实例与数据库的关系通常是一一对应的,即一个实例对应一个数据库。但是在集群情况下可能存在一个数据库被多个数据实例使用的情况。
MySQL数据库实例在系统上的表现就是一个进程。
解释:
OLTP:在线事务处理
MVCC:多版本并发控制
2.MySQL体系结构
MySQL由以下几个部分组成:
-
连接池组件
-
管理服务和工具组件
-
SQL接口组件
-
查询分析器组件
-
优化器组件
-
缓冲组件
-
插件式存储引擎
-
物理文件
需要特别注意的是,存储引擎是基于表的,而不是数据库。
3.MySQL存储引擎
-
InnoDB存储引擎
支持事务,行锁设计、支持外键,支持非锁定读。通过使用多版本并发控制来获得高并发性,实现了4中隔离级别,默认为REPEATABLE级别。同时,使用一种被称为next key locking的策略来避免幻读现象的产生。还提供了插入缓冲、二次写、自适应哈希索引、预读等高性能和高可用的功能。
对于表中数据的存储,InnoDB存储引擎采用了聚集的方式,因此每张表的存储都是按主键的顺序进行存放。如果没有显示地在表定义时指定主键,InnoDB存储引擎会为每一行生成一个6字节的ROWID,并以此作为主键。
-
MyISAM存储引擎
不支持事务、表锁设计,支持全文索引,主要面向一些OLAP数据库应用。缓冲池只缓存索引文件,而不缓冲数据文件。表由MYD和MYI组成,MYD用来存放数据文件,MYI用来存放索引文件。可以通过使用myisam pack工具进一步压缩,压缩后的表是制度的,但可以通过myisampack来解压数据文件。5.0开始,默认支持256TB的单表数据。
-
NDB存储引擎
是一个集群存储引擎,类似于Oracle的RAC集群。数据全部放在内存中(5.1开始,可以将非索引数据放在磁盘上),因此主键查找速度极快。NDB存储引擎的连接操作(JOIN)是在MySQL数据库层完成的,而不是在存储引擎层完成的。这意味着,复杂的连接操作需要巨大的网络开销,因此查询速度很慢。
-
Memory存储引擎
之前称为HEAP存储引擎。只支持表锁,并发性能查,不支持TEXT和BLOB列类型。将表中的数据存放在内存中,如果数据库重启或发生崩溃,表中的数据都将消失。它非常适用于存储临时数据的临时表,以及数据仓库中的纬度表。默认使用哈希索引,而不是我们熟悉的B+树索引。
-
Archive存储引擎
只支持INSERT和SELECT操作,从5.1开始支持索引。使用zlib算法将数据行进行压缩后存储,压缩比一般可达1:10。非常适合存储归档数据,如日志信息。
-
Federated存储引擎
表不存放数据,只是指向一台远程MySQL数据库服务器上的表。
-
Maria存储引擎
新开发的引擎,设计目标是取代MyISAM存储引擎。支持缓存数据和索引文件,应用了行锁设计,提供了MVCC功能,支持事务和非事务安全的选项。
-
其他存储引擎
包括Merge、CSV、Sphinx、Infobright。
4.各存储引擎之间的比较
下图取自MySQL官方手册,展现了一些常用MySQL存储引擎之间的不同之处,包括存储容量的限制、事务支持、锁的粒度、MVCC支持、支持的索引、备份和复制等。
网友评论