您的位置:首页 > 汽车 > 时评 > 河北今天最新疫情_网站编程入门_上海优化价格_广告多的网站

河北今天最新疫情_网站编程入门_上海优化价格_广告多的网站

2024/12/23 6:32:09 来源:https://blog.csdn.net/qq_43380361/article/details/142779081  浏览:    关键词:河北今天最新疫情_网站编程入门_上海优化价格_广告多的网站
河北今天最新疫情_网站编程入门_上海优化价格_广告多的网站

CK没有更新的方法,但是有一种引擎可以支持去重,它就是ReplicatedReplacingMergeTree;

一种是手工执行optimize table;

另一种是table后面加final关键字;

如何设置去重?
需要指定order key;注意不是primary key;
但是,如果同一order key散落到了不同的分区、不同的分片中,去重会失效;
换言之,只能自动合并同一分区,同一分片的相同ID;
同一个order key要保留哪个?
在本地表最后一个参数上加上一个时间戳;CK会自动取最新的;

CREATE TABLE default.test
(
ID String COMMENT ‘主键编号’,
NAME Nullable(String) COMMENT ‘名称’,
CRT_TIMEDateTime COMMENT '创建时间', TIMESTAMP` Int64
)
ENGINE = ReplicatedReplacingMergeTree(‘/clickhouse/tables/01/test/’,
‘replica101’,
TIMESTAMP)
PARTITION BY toMonth(CRT_TIME)
ORDER BY TIMESTAMP
SETTINGS index_granularity = 8192;

属性介绍:
ENGINE:表引擎,最常用的是MergeTree,或者说MergeTree家族的各个引擎,当然也可以选择其他引擎。但是,只有MergeTree系列的表引擎才支持主键索引,数据分区,数据副本,数据采样这样的特性,只有此系列的表引擎才支持alter操作。
PARTITION BY:指定分区键,主要根据你的业务场景和数据量大小,可以按年、按月、按天或者其他时间间隔分区,也可以按照哈希去分区。当然,若不声明分区键,则clickhouse会生成一个名为all的分区
ORDER BY:排序字段,clickhouse表会根据排序字段建索引,方便快速查找。如果没有指定主键,排序字段就是主键
PRIMARY KEY:指定主键,它必须是分区键的前缀,或者等于分区键
SETTINGS:配置项,可以把一些配置在这里设置,多个逗号分割
index_granularity:默认8192,表示索引的粒度,即MergeTree的索引在默认情况下,每间隔8192行才生成一个索引。通常不需要修改此参数,不设置就是8192。
old_parts_lifetime:已合并的分区块,多久后删除,默认8分钟

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com