Table of Contents

ClickHouse 尝试
#

表分区
#

对于如下的表在执行插入数据的时候

CREATE TABLE uk.uk_price_paid_simple
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
ORDER BY (town, street);

每当一组数据插入的时候就会创建一个数据分区

他会经过如下的步骤最后存储落落盘到磁盘

排序按照order by 规则进行排序
拆分对排序后的结果进行拆分成为单独的列
压缩数据对每一列数据进行压缩
写入磁盘写入的是数据分区

需要注意到的是每一组数据在落盘之后需要进行分区合并也就是将多个分区合并成为一个较大的分区也就是实现了ck所描述的merge操作形成了merge后的tree

对于创建的表如果申明了分区的时候可以定义某一行所属的分区

比如这里的sql语句就实现了表的数据片段按照时间来进行划分

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
ORDER BY (town, street)
PARTITION BY toStartOfMonth(date);