美文网首页
2022-12-20开发小窍门

2022-12-20开发小窍门

作者: felix_feng | 来源:发表于2022-12-19 11:10 被阅读0次

    在 StarRocks 中提供了三种不同类型的 join:

    当小表与大表关联时,可以使用 boardcast join,小表会以广播的形式加载到不同节点的内存中
    当大表与大表关联式,可以使用 shuffle join,两张表值相同的数据会 shuffle 到相同的机器上
    为了避免 shuffle 带来的网络与 I/O 的开销,也可以在创建表示就将需要关联的数据存储在同一个 colocation group 中,使用 colocation join

    CREATE TABLE tbl (k1 int, v1 int sum)
    DISTRIBUTED BY HASH(k1)
    BUCKETS 8
    PROPERTIES(
        "colocate_with" = "group1"
    );
    

    相关文章

      网友评论

          本文标题:2022-12-20开发小窍门

          本文链接:https://www.haomeiwen.com/subject/ixyyqdtx.html