1、MySQL存储引擎概述
插件式存储引擎是MySQL数据库最重要的特性之一,用户可以根据应用的需要选择如何存储和索引数据、是否使用事务等。MYSQL默认支持多种存储引擎,以适用于不同领域的数据库应用需要,用户可以通过选择使用不同的存储引擎提高应用的效率,提供灵活的存储,用户甚至可以按照自己的需要定制和使用自己的存储引擎,以实现最大程度的可定制性。
MySQL5.0支持的存储引擎包括MyISAM、InnoDB、BDB、MEMORY、MERGE、EXAMPLE、NDB Cluster、ARCHIVE、CSV、BLACKHOLE、FEDERATED等,其中InnoDB和BDB提供事务安全表、其他存储引擎都是非事务安全表。
创建新表时如果不指定存储引擎,那么系统就会使用默认存储引擎,MySQL5.5之前的默认存储引擎是MyISAM,5.5之后改为了InnoDB。如果要修改默认的存储引擎,可以在参数文件中配置default-table-type。查看当前的默认存储引擎,可以使用“show variables like 'table_type';”命令。
查询当前数据库支持的存储引擎可以使用“show egnines;”命令或“show variables like 'have%'”命令。
在创建表的时候,可以通过增加engine关键字设置表的存储引擎,也可以在表创建之后使用alter table语句,将一个已经存在的表修改成其他的存储引擎。
2、各种存储引擎的特性
2.1、常用存储引擎的对比
2.2、MyISAM
MyISAM不支持事务、也不支持外键,其优势是访问的速度快,对事务完整性没有要求或者以select、insert为主的应用基本上都可以使用这个引擎来创建表。
每个MyISAM在磁盘上存储成3个文件,其文件名都和表名相同,但扩展名分别是:.frm(存储表定义)、.MYD(存储数据)和.MYI(存储索引)。数据文件和索引文件可以放置在不同的目录,平均分布IO,获得更快的速度。指定索引文件和数据文件的路径,需要在创建表的时候通过data directory和index directory语句指定。文件路径需要是绝对路径并且具有访问权限。
MyISAM类型的表可能会损坏,原因有很多种,损坏后的表可能不能被访问,会提示需要修复或者访问后返回错误的结果。MyISAM类型的表提供修复的工具,可以用check table语句来检查MyISAM的健康,并用perair table语句修复损坏的MyISAM表。表损坏可能导致数据库异常重新启动,需要尽快修复并尽可能地确认损坏的原因。
MyISAM的表支持3中不同的存储格式,分别是:静态表、动态表和压缩表。
静态表是默认的存储格式。静态表中的字段都是非变长字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复。缺点是占用的空间通常比动态表多。
动态表中包含变长字段,记录不是固定长度的,这种存储的有点是占用的空间相对较少,但是频繁地更新和删除记录会产生碎片,需要定期执行optimize table语句或myisamchk -r命令来改善性能,并且在出现故障时恢复相对比较困难。
压缩表由myisampack工具创建,占据非常小的磁盘空间。因为每个记录是被单独压缩的,所以只有非常小的访问开支。
2.3、InnoDB
InnoDB存储引擎提供了具有提交、回滚和崩溃恢复能力的事务安全。但是对比MyISAM的存储引擎,InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保留数据和索引。
下面重点介绍存储引擎为InnoDB的表在使用过程中不同于使用其他存储引擎的表的特定。
(一)自动增长列
InnoDB表的自动增长列可以手工插入,但是插入的值如果是空或者0,则实际插入的将是自动增长后的值。对于InnoDB表,自动增长列必须是索引。如果组合索引,也必须是组合索引的第一列。但是对于MyISAM表,自动增长列可以是组合索引的其他列,这样插入记录后,自动增长列是按照组合索引的前面几列进行排序后递增的。
(二)外键约束
MySQL支持外键的存储引擎只有InnoDB,子表在创建外键的时候,要求父表必须有对应的索引,同时自己也会自动创建对应的索引(外键索引)。在创建时,可以指定在删除、更新父表时,对子表进行的相应操作,包括restrict、cascade、set null和no action。其中restrict和no action相同,是指限制在子表有关联记录的情况下父表不能更新;cascade表示父表在更新或者删除时,更新或者删除子表对应记录;set null表示父表在更新或者删除的时候,子表的对应字段被set null。选择后两种方式的时候需要谨慎,可能会因为错误的操作导致数据的丢失。
(三)存储方式
InnoDB存储表和索引有以下两种方式:
(1)使用共享表空间存储,这种方式创建的表的表结构保存在.frm文件中,数据和索引保存在innodb_data_home_dir和innodb_data_file_path定义的表空间中,可以是多个文件。
(2)使用多表空间存储,这种方式创建的表的表结构仍然保存在.frm文件中,但是每个表的数据和索引单独保存在.ibd中。如果是个分区表,则每个分区对应单独的.ibd文件,文件名是“表名 + 分区名”,可以在创建分区的时候指定每个分区的数据文件的位置,以此来将表的IO均匀分布在多个磁盘上。
要使用多表空间的存储方式,需要设置参数innodb_file_per_table,并且重新启动服务后才可以生效,对于新建的表按照多表空间的方式创建,已有的表仍然使用共享表空间存储。如果将已有的多表空间方式修改回共享表空间方式,则新建表会在共享表空间中创建,但已有的多表空间的表仍然保存原来的访问方式。所以参数生效后,只对新建的表生效。
多表空间的数据文件没有大小限制,不需要设置初始大小,也不需要设置文件的最大限制、扩展大小等参数。
对于使用多表空间的表,可以比较方便的进行单表备份和恢复操作,但是直接复制.ibd文件是不行的,因为没有共享表空间的数据字典信息,直接复制的.ibd文件和.frm文件恢复时是不能被正确识别的,但可以通过以下命令:
alter table tb1_name discard tablespace;
alter table tb1_name import tablespace;
将备份恢复到数据库中,但是这样的单表备份,只能恢复到表原来所在的数据库中,而不能恢复到其他的数据库中。如果要将单表恢复到目标数据库。则需要通过mysqldump和mysqlimport来实现。
2.4、MEMORY
MEMORY存储引擎使用存在于内存中的内容来创建表。每个MEMORY表只实际对应一个磁盘文件,格式是.frm。MEMORY类型的表访问非常地快,因为它的数据是放在内存中的,并且默认使用HASH索引,但是一旦服务关闭,表中的数据就会丢失掉。
在启动MySQL服务的时候使用--init-file选项,把insert into ... select或load data infile这样的语句放入这个文件中,就可以在服务启动时从持久稳固的数据源装载表。
服务器需要足够内存来维持所有在同一实践使用的MEMORY表,当不再需要MEMORY表的内容之时,需要释放被MEMORY表使用的内存,应该执行delete from或truncate tale,或者整个地删除表(使用drop table操作)。
每个MEMORY表中可以防止的数据量的大小,受到max_heap_table_size系统变量的约束,这个系统变量的初始值是16MB,可以根据需要增加。此外,在定义MEMORY表的时候,可以通过MAX_ROWS子句指定表的最大行数。
MEMORY类型的存储引擎主要用于那些内容变化不频繁的代码表,或者作为统计操作的中间结果表,便于高效地对中间结果进行分析并得到最终的统计结果。对存储引擎为MEMORY的表进行更新操作要谨慎,因为数据并没有实际写入到磁盘,所以一定要对下次重新启动服务后如何获得这些修改后的数据有所考虑。
2.5、MERGE
MERGE存储引擎是一组MyISAM表的组合,这些MyISAM表必须结构完全相同,MERGE表本身并没有数据,对MERGE类型的表可以进行查询、更新、删除操作,这些操作实际上是对内部的MyISAM表进行的。对弈MERGE类型表的插入操作,是通过insert_method子句定义插入的表,可以有3个不同的值,使用first或last值使得插入操作被相应的作用在第一或最后一个表上,不定义这个子句或者定义为no,表示不能对这个MERGE表执行插入操作。
可以对MERGE表进行drop操作,这个操作只是删除MERGE的定义,对内部的表没有任何影响。
MERGE表在磁盘上保留两个文件,文件名以表的名字开始,一个.frm文件存储表定义,另一个.MRG文件包含组合表的信息,包括MERGE表由哪些表组成、插入新的数据时的依据。可以通过修改.MRG文件来修改MERGE表,但是修改后要通过flush tables刷新。
网友评论