美文网首页
Clickhouse share

Clickhouse share

作者: Ary_zz | 来源:发表于2019-10-18 11:32 被阅读0次

    2019-10-18

    clickhouse

    basic

    • 分布式列数据库

    • 集群规模线性扩展

    • 多副本

    定义分布式表需确定cluster name (system.cluster查看)

    shards规则可选,随机rand(),按string字段sipHash(xxx)

    推荐通过分布式表做查询,写入本地表

    feature

    • 多核硬件环境下,单个查询的并行处理

    • 多个服务器环境下,分布式处理

    • 适用于实时查询

    • 宽表支持

    • 几乎支持标准sql

    • 近似计算

    • 不同存储,各种mergeTree

    • 适合结构日志、事件数据、时间序列数据(mergeTree存储需要数据域)

    • 支持主键索引

    • 数据副本间完整性支持

    merge tree

    GraphiteMergeTree

    实时数据,按时间版本

    ReplacingMergeTree

    按主键去重

    Concurrent Data Access

    For concurrent table access, we use multi-versioning. In other words, when a table is simultaneously read and updated, data is read from a set of parts that is current at the time of the query. There are no lengthy locks. Inserts do not get in the way of read operations.

    磁盘格式

    • /data

      • /db/table

        • /part-block_number-level

          • CheckSums.txt

          • Columns.txt

          • Primary.txt 主键索引文件

            • .mrk

            • .bin

    View 增量 建议batch

    query

    array join 行列转换 (datatype=array)

    server 扫描配置文件/30s

    副本表

    layer-shard/table,(replica)

    zk

    以part为粒度做merge,保证副本

    autopurge.snapRetainCount

    replica间同步merge,zk管理merge是否一致

    避免小part

    相关文章

      网友评论

          本文标题:Clickhouse share

          本文链接:https://www.haomeiwen.com/subject/birimctx.html