分区表

作者: 骁兵 | 来源:发表于2019-02-28 23:10 被阅读4次

水平分区和局部分区索引

  InnoDB支持分区表的水平分区,不支持垂直分区

  • 水平分区,指将同一个表中不同行的记录分配到不同的物理文件中
  • 垂直分区,指将同一个表中不同列的记录分配到不同的物理文件中

  同时,MySQL数据库支持的分区是局部分区索引,一个分区中既存放了数据又存放了索引。而全局分区是指,数据存放在各个分区中,但是所有数据的索引放在同一个对象中。

查看数据库是否启用了分区功能
show variables like '%partition%'

  启动了分区后,一个表的数据会存放到多个ibd文件中(而不是只有一个)。
  可以通过information_schema架构下的PATITIONS表来查看每个分区的具体信息,table_rows表示每个区包含多少行数据。

select * from information_schema.PARTITIONS
where table_schema=database() and table_name='t'

分区类型

当前Mysql数据库支持以下几种类型的分区:

  • Range分区:行数据基于一个给定连续区间的列值放入分区。Mysql数据库5.5开始支持Range Columns分区。
  • List分区:和Range分区类似,只是List分区面向的是离散的值。Mysql数据库5.5开始支持List Columns分区。
  • Hash分区:根据用户自定义的表达式的返回值来进行分区,返回值不能为负数。
  • Key分区:根据Mysql数据库提供的哈希函数来进行分区。

  range/list/hash/key这四种分区方式,分区数据都必须是整型,如果不是整型,应该通过函数将其转化为整型,如YEAR()、TO_DAYS()、MONTH()等。

Range分区
create table t(
  id int
)engine=innodb
partition by range(id)(
partition p0 values less than(10),
partition p1 values less than(20));

  如上图分区定义,如果现在插入一个id=30的数据,会抛出异常,因为30不能被分配到任何分区中。
  使用Range分区,用来管理日期数据可以方便很多,比如

create table sales(
  money int unsigned not null,
  date datetime
)engine=innodb
partition by range (year(date)) (
  partition p2008 value less than (2009),
  partition p2009 value less than (2010),
  partition p2010 value less than (2011)
);

  当要删除2008年的数据,不用使用delete语句,只需要删除p2008这个分区即可。

alter table sales drop partition p2008;

  并且,如果只需要搜索2008年的数据时(在where语句中写明条件),通过explain可以看到,只会去搜索p2008这个分区,而不会看其他分区,提高了查询速度。这种优化只对YEAR()、TO_DAYS()、TO_SECONDS()、UNIX_TIMESTAMP()有效。

List分区
create table t(
  a int,
  b int
) engine=innodb
partition by list(b)(
  partition p0 values in (1,3,5,7,9),
  partition p1 values in (0,2,4,6,8)
);
Hash分区
create table t(
  a int,
  b datetime
) engine=innodb
partition by hash(year(b))
partitions 4;

MOD(year('2010-04-01'),4)
=MOD(2010,4)
=2

KEY分区
create table t_key(
  a int,
  b datetime
) engine=innodb
partition by key(b)
partitions 4;

子分区

  在分区的基础上再进行分区。

create table ts(a int,b date) engine=innodb
partition by range(year(b))
subpartition by hash (to_days(b))
subpartition 2(
  partition p0 values less than (1990),
  partition p1 values less than (2000),
  partition p2 values less than maxvalue,
);

  表ts先根据b列进行了Range分区,然后又进行了一次Hash分区,所以分区的数量是3*2=6。
  子分区可以用于特别大的表,在多个磁盘间分别分配数据和索引,在创建分区时,可以指定存放磁盘目录。

处理NULL值

  对于Range分区,MySQL数据库会将该值放到最左边的分区。
  在List分区下,要使用NULL值,则必须显式指出在哪个分区放入NULL值。
  HASH和KEY分区,任何分区函数都会将NULL值的记录返回为0。

性能

  对于一张大表,一般的b+树需要2~3次的磁盘IO,因此B+树可以很好地完成操作,不需要分区的帮助,并且设计不好的分区会带来严重的性能问题。

相关文章

  • MBR分区与GPT分区

    Linux系统中有两种常见的分区表 MBR分区表(主引导记录分区表)和 GPT分区表(GUID分区表) MBR分区...

  • Vertica的这些事(九)—— vertica存储统计信息

    vertica存储统计信息: 表数量: 分区表数量: 总表占大小: 分区表总大小: 分区表大小(前10): 分区表...

  • MySQL-31.分区表

    分区表有什么问题,为什么公司规范不让使用分区表呢? 1.分区表是什么? 为了说明分区表的组织形式,先创建一个表 t...

  • Impala分区表

    摘要:Impala,分区表,hdfs 分区表 分区表就是将某个分区的数据的单独存放,当使用where语句是针对某个...

  • 如何将硬盘分区表转换为GUID(GPT)分区表

    如何将硬盘分区表转换为GUID(GPT)分区表 如果不知道自己的硬盘分区表类型可以参看 Windows--如何查看...

  • PostgreSQL实现数据表分区

    1.建表 2.创建子表(分区表) 根据主表的创建日期月份来建立分区 3.给分区表创建主键 继承主表的分区表无法继承...

  • 高水位线处理

    1. 查询高水位情况 查询块大小 查询10G水位线上的对象 2. 清理分区表 移动分区表 删除分区表 3. 移动表...

  • Linux安装-分区和格式化

    1.两种分区表形式(针对一块硬盘) MBR分区表(主引导记录分区表):最大支持2.1TB硬盘,最多支持4个分区 G...

  • Hive创建分区表,动态插入数据

    1、创建分区表

  • create table tmp_table_name as .

    1.hive中用CTAS 创建表,所创建的表统一都是非分区表,不管源表是否是分区表。所以对于分区表的创建使用cre...

网友评论

    本文标题:分区表

    本文链接:https://www.haomeiwen.com/subject/miyluqtx.html