美文网首页
学习shardIng-精确分片

学习shardIng-精确分片

作者: Spring_java | 来源:发表于2021-10-22 15:48 被阅读0次

    Sharding-JDBC认为对于分片策略存有两种维度:

    数据源分片策略(DatabaseShardingStrategy):数据被分配的目标数据源
    表分片策略(TableShardingStrategy):数据被分配的目标表

    两种分片策略API完全相同,但是表分片策略是依赖于数据源分片策略的(即:先分库然后才有分表)

    分片算法

    通过分片算法将数据分片,支持通过=、>=、<=、>、<、BETWEEN和IN分片。分片算法需要应用方开发者自行实现,可实现的灵活度非常高。

    目前提供4种分片算法。由于分片算法和业务实现紧密相关,因此并未提供内置分片算法,而是通过分片策略将各种场景提炼出来,提供更高层级的抽象,并提供接口让应用开发者自行实现分片算法。

    • 精确分片算法
      对应PreciseShardingAlgorithm,用于处理使用单一键作为分片键的=与IN进行分片的场景。需要配合StandardShardingStrategy使用。

    • 范围分片算法
      对应RangeShardingAlgorithm,用于处理使用单一键作为分片键的BETWEEN AND、>、<、>=、<=进行分片的场景。需要配合StandardShardingStrategy使用。

    • 复合分片算法
      对应ComplexKeysShardingAlgorithm,用于处理使用多键作为分片键进行分片的场景,包含多个分片键的逻辑较复杂,需要应用开发者自行处理其中的复杂度。需要配合ComplexShardingStrategy使用。

    • Hint分片算法
      对应HintShardingAlgorithm,用于处理使用Hint行分片的场景。需要配合HintShardingStrategy使用。

    分片策略

    包含分片键和分片算法,由于分片算法的独立性,将其独立抽离。真正可用于分片操作的是分片键 + 分片算法,也就是分片策略。目前提供5种分片策略。

    • 标准分片策略
      对应StandardShardingStrategy。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。StandardShardingStrategy只支持单分片键,提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法。PreciseShardingAlgorithm是必选的,用于处理=和IN的分片。RangeShardingAlgorithm是可选的,用于处理BETWEEN AND, >, <, >=, <=分片,如果不配置RangeShardingAlgorithm,SQL中的BETWEEN AND将按照全库路由处理。

    • 复合分片策略
      对应ComplexShardingStrategy。复合分片策略。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。ComplexShardingStrategy支持多分片键,由于多分片键之间的关系复杂,因此并未进行过多的封装,而是直接将分片键值组合以及分片操作符透传至分片算法,完全由应用开发者实现,提供最大的灵活度。

    • 行表达式分片策略
      对应InlineShardingStrategy。使用Groovy的表达式,提供对SQL语句中的=和IN的分片操作支持,只支持单分片键。对于简单的分片算法,可以通过简单的配置使用,从而避免繁琐的Java代码开发,如: t_user_$->{u_id % 8} 表示t_user表根据u_id模8,而分成8张表,表名称为t_user_0到t_user_7。

    • Hint分片策略
      对应HintShardingStrategy。通过Hint指定分片值而非从SQL中提取分片值的方式进行分片的策略。

    • 不分片策略
      对应NoneShardingStrategy。不分片的策略。

    建表语句

    CREATE TABLE `t_order_0` (
      `order_id` bigint DEFAULT NULL COMMENT '订单号',
      `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
      `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
    
    CREATE TABLE `t_order_1` (
      `order_id` bigint DEFAULT NULL COMMENT '订单号',
      `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
      `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
    
    CREATE TABLE `sku_1` (
      `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
      `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
      `order_id` bigint DEFAULT NULL COMMENT '订单ID'
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
    
    CREATE TABLE `sku_0` (
      `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
      `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
      `order_id` bigint DEFAULT NULL COMMENT '订单ID'
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
    
    

    1: 重点

    order_id 是bigint 类型的 我采用了行表达式分片策略,直接配置的,由于找不到怎么配置varchar 所以我才不得不开始学习怎么重写实现方法。

    代码1 使用标准分片:

    @Slf4j
    public class MyPreciseShardingAlgorithm implements PreciseShardingAlgorithm<String> {
    
        /**
         * Sharding.
         * 实现标准分片策略,通过计算分到不同的表来实现分表策略。
         * @param collection available data sources or tables's names
         * @param preciseShardingValue        sharding value
         * @return sharding result for data source or table's name
         */
        @Override
        public String doSharding(Collection<String> collection, PreciseShardingValue<String> preciseShardingValue) {
            Comparable value = preciseShardingValue.getValue();
            String columnName = preciseShardingValue.getColumnName();
            String logicTableName = preciseShardingValue.getLogicTableName();
            log.info("collection:" + JSON.toJSONString(collection) + ",preciseShardingValue:" + JSON.toJSONString(preciseShardingValue));
            String data = value.toString();
            int size = collection.size();
            for(String tableName: collection){
                int index = Math.abs(data.hashCode() % size);
                if(tableName.endsWith(index+"")){
                    return tableName;
                }
            }
            return null;
        }
    }
    

    配置:

    spring:
      main:
        allow-bean-definition-overriding: true
      # 相关的配置
      shardingsphere:
        props:
          sql:
            show: true
        datasource:
          names: ds1
          ds1:
            type: com.zaxxer.hikari.HikariDataSource
            driver-class-name: com.mysql.cj.jdbc.Driver
            jdbcUrl: jdbc:mysql://localhost:3306/springcloud?serverTimezone=CTT&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&useSSL=false
            username: root
            password: root
        sharding:
          tables:
            # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
            t_order:
              # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
              # 这个配置是告诉sharding有多少个表
              actual-data-nodes: ds1.t_order_$->{0..1}
              # 配置其分片策略和分片算法
              table-strategy:
                # 行表达式
                inline:
                  # 配置sharding的计算列
                  sharding-column: order_id
                  # 配置sharding的表达式,对应的n_id必须和sharding-column的值对应,否则报错
                  algorithm-expression: t_order_$->{order_id % 2}
            # 这个地方注意: sharding-jdbc会根据名称去找本节点,所以写sql的时候,要写此节点的名称
            sku:
              # 表达式, 健康节点: 根据上一个节点找到此值, {0..1}为groovy语言,$会替换成{0..1}的一个值,数据库表是: book_0 , book_1
              # 这个配置是告诉sharding有多少个表
              actual-data-nodes: ds1.sku_$->{0..1}
              # 配置其分片策略和分片算法
              table-strategy:
                standard:
                  sharding-column: sku_id
                  precise-algorithm-class-name: com.xulei.spring.shardConfig.MyPreciseShardingAlgorithm
    
    

    具体配置在starter下面的json文件。

    实际案例:

        select  sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
            from t_order,sku
            where t_order.order_id=sku.order_id
            and t_order.order_id =3
    因为t_order表里面是采用了order_id 进行分片,所以具体执行sql 只查询了1个库 t_order_1。
    
    image.png

    sql 修改:
    select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
    from t_order,sku
    where t_order.order_id=sku.order_id
    and sku.order_id =3
    结果就是全表扫描了。因为sku 表是根据sku_id 来进行分表的


    image.png

    相关文章

      网友评论

          本文标题:学习shardIng-精确分片

          本文链接:https://www.haomeiwen.com/subject/cwocaltx.html