学习shardIng-精确分片

作者: Spring_java | 来源:发表于2021-10-22 15:48 被阅读0次

学习shardIng-精确分片
缓存中间件Redis Cluster集群模式
ShardingSphere官网及总结
学习python分片
日知录1-数据分片模型和路由算法
学习使我快乐番外篇十二：分片
MongoDB 集群
number_of_shards的理解
MongoDB分片群集组件
第三章索引、文档与Mapping

Sharding-JDBC认为对于分片策略存有两种维度：

数据源分片策略（DatabaseShardingStrategy）：数据被分配的目标数据源
表分片策略（TableShardingStrategy）：数据被分配的目标表

两种分片策略API完全相同，但是表分片策略是依赖于数据源分片策略的（即：先分库然后才有分表）

分片算法

通过分片算法将数据分片，支持通过=、>=、<=、>、<、BETWEEN和IN分片。分片算法需要应用方开发者自行实现，可实现的灵活度非常高。

目前提供4种分片算法。由于分片算法和业务实现紧密相关，因此并未提供内置分片算法，而是通过分片策略将各种场景提炼出来，提供更高层级的抽象，并提供接口让应用开发者自行实现分片算法。

精确分片算法
对应PreciseShardingAlgorithm，用于处理使用单一键作为分片键的=与IN进行分片的场景。需要配合StandardShardingStrategy使用。
范围分片算法
对应RangeShardingAlgorithm，用于处理使用单一键作为分片键的BETWEEN AND、>、<、>=、<=进行分片的场景。需要配合StandardShardingStrategy使用。
复合分片算法
对应ComplexKeysShardingAlgorithm，用于处理使用多键作为分片键进行分片的场景，包含多个分片键的逻辑较复杂，需要应用开发者自行处理其中的复杂度。需要配合ComplexShardingStrategy使用。
Hint分片算法
对应HintShardingAlgorithm，用于处理使用Hint行分片的场景。需要配合HintShardingStrategy使用。

分片策略

包含分片键和分片算法，由于分片算法的独立性，将其独立抽离。真正可用于分片操作的是分片键 + 分片算法，也就是分片策略。目前提供5种分片策略。

标准分片策略
对应StandardShardingStrategy。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。StandardShardingStrategy只支持单分片键，提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法。PreciseShardingAlgorithm是必选的，用于处理=和IN的分片。RangeShardingAlgorithm是可选的，用于处理BETWEEN AND, >, <, >=, <=分片，如果不配置RangeShardingAlgorithm，SQL中的BETWEEN AND将按照全库路由处理。
复合分片策略
对应ComplexShardingStrategy。复合分片策略。提供对SQL语句中的=, >, <, >=, <=, IN和BETWEEN AND的分片操作支持。ComplexShardingStrategy支持多分片键，由于多分片键之间的关系复杂，因此并未进行过多的封装，而是直接将分片键值组合以及分片操作符透传至分片算法，完全由应用开发者实现，提供最大的灵活度。
行表达式分片策略
对应InlineShardingStrategy。使用Groovy的表达式，提供对SQL语句中的=和IN的分片操作支持，只支持单分片键。对于简单的分片算法，可以通过简单的配置使用，从而避免繁琐的Java代码开发，如: t_user_$->{u_id % 8} 表示t_user表根据u_id模8，而分成8张表，表名称为t_user_0到t_user_7。
Hint分片策略
对应HintShardingStrategy。通过Hint指定分片值而非从SQL中提取分片值的方式进行分片的策略。
不分片策略
对应NoneShardingStrategy。不分片的策略。

建表语句

CREATE TABLE `t_order_0` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `t_order_1` (
  `order_id` bigint DEFAULT NULL COMMENT '订单号',
  `cust_id` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '客户id',
  `order_time` varchar(20) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '下单时间'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_1` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

CREATE TABLE `sku_0` (
  `sku_id` varchar(60) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku号',
  `sku_name` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT 'sku名称',
  `order_id` bigint DEFAULT NULL COMMENT '订单ID'
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

1: 重点

order_id 是bigint 类型的我采用了行表达式分片策略，直接配置的，由于找不到怎么配置varchar 所以我才不得不开始学习怎么重写实现方法。

代码1 使用标准分片：

@Slf4j
public class MyPreciseShardingAlgorithm implements PreciseShardingAlgorithm<String> {

    /**
     * Sharding.
     * 实现标准分片策略，通过计算分到不同的表来实现分表策略。
     * @param collection available data sources or tables's names
     * @param preciseShardingValue        sharding value
     * @return sharding result for data source or table's name
     */
    @Override
    public String doSharding(Collection<String> collection, PreciseShardingValue<String> preciseShardingValue) {
        Comparable value = preciseShardingValue.getValue();
        String columnName = preciseShardingValue.getColumnName();
        String logicTableName = preciseShardingValue.getLogicTableName();
        log.info("collection:" + JSON.toJSONString(collection) + ",preciseShardingValue:" + JSON.toJSONString(preciseShardingValue));
        String data = value.toString();
        int size = collection.size();
        for(String tableName: collection){
            int index = Math.abs(data.hashCode() % size);
            if(tableName.endsWith(index+"")){
                return tableName;
            }
        }
        return null;
    }
}

配置：

spring:
  main:
    allow-bean-definition-overriding: true
  # 相关的配置
  shardingsphere:
    props:
      sql:
        show: true
    datasource:
      names: ds1
      ds1:
        type: com.zaxxer.hikari.HikariDataSource
        driver-class-name: com.mysql.cj.jdbc.Driver
        jdbcUrl: jdbc:mysql://localhost:3306/springcloud?serverTimezone=CTT&useUnicode=true&characterEncoding=utf-8&allowMultiQueries=true&useSSL=false
        username: root
        password: root
    sharding:
      tables:
        # 这个地方注意： sharding-jdbc会根据名称去找本节点，所以写sql的时候，要写此节点的名称
        t_order:
          # 表达式， 健康节点： 根据上一个节点找到此值， {0..1}为groovy语言，$会替换成{0..1}的一个值，数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.t_order_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            # 行表达式
            inline:
              # 配置sharding的计算列
              sharding-column: order_id
              # 配置sharding的表达式,对应的n_id必须和sharding-column的值对应，否则报错
              algorithm-expression: t_order_$->{order_id % 2}
        # 这个地方注意： sharding-jdbc会根据名称去找本节点，所以写sql的时候，要写此节点的名称
        sku:
          # 表达式， 健康节点： 根据上一个节点找到此值， {0..1}为groovy语言，$会替换成{0..1}的一个值，数据库表是: book_0 , book_1
          # 这个配置是告诉sharding有多少个表
          actual-data-nodes: ds1.sku_$->{0..1}
          # 配置其分片策略和分片算法
          table-strategy:
            standard:
              sharding-column: sku_id
              precise-algorithm-class-name: com.xulei.spring.shardConfig.MyPreciseShardingAlgorithm

具体配置在starter下面的json文件。

实际案例：

    select  sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
        from t_order,sku
        where t_order.order_id=sku.order_id
        and t_order.order_id =3
因为t_order表里面是采用了order_id 进行分片，所以具体执行sql 只查询了1个库 t_order_1。

image.png

sql 修改：
select sku.order_id,t_order.order_time,sku.sku_id,sku.sku_name
from t_order,sku
where t_order.order_id=sku.order_id
and sku.order_id =3
结果就是全表扫描了。因为sku 表是根据sku_id 来进行分表的

image.png

学习shardIng-精确分片
Sharding-JDBC认为对于分片策略存有两种维度：数据源分片策略（DatabaseShardingStra...
缓存中间件Redis Cluster集群模式
1. Redis Cluster简介 1.1 什么是集群模式？集群是指：多个主从(sharding-分片)模式...
ShardingSphere官网及总结
中文文档分片分片算法精确分片算法范围分片算法复合分片算法 Hint分片算法分片策略标准分片策略复合...
学习python分片
序列和索引既然谈到分片，就脱离不了序列和索引这些概念。什么是序列呢？在Python中，最基本的数据结构是序列（...
日知录1-数据分片模型和路由算法
分片模型：先将数据映射到分片；再将分片映射到机器；都是多对一的关系。分片策略：哈希分片和范围分片。哈希分片通...
学习使我快乐番外篇十二：分片
今天本小白继续学习小虎总的墨客介绍系列文章之墨客分片介绍。这篇文章介绍了墨客的分片技术，并于以太坊的分片技术进行了...
MongoDB 集群
分片群集 MongoDB分片群集由以下组件组成：分片：每个分片包含分片数据。每个分片都可以部署为副本集。 mon...
number_of_shards的理解
分片理论知识分片数量总分片数=主分片数（副分片数+1）"settings": {"number_of_shard...
MongoDB分片群集组件
MongoDB分片群集包含以下组件：分片：每个分片包含分片数据的子集。从MongoDB 3.6开始，必须将分片部...
第三章索引、文档与Mapping
一、核心概念节点节点就是一个ES的进程分片分片分为主分片与副本分片主分片负责写入数据副本分片只负责查询...