经过接近7个月的测试, 目前两级存储中共有5.1亿条数据, 总数据量约230GB. SSD中热数据量约为10%
背景: 因为SSD存储太贵, 而且一般只有最近14天的数据需要经常查询, 因此把14天外的数据送到HDD里保存节约成本.
- 需要新增存储配置文件
storage.xml
其中cold_disk
为HDD存储配置,cold_volume
为HDD存储策略
1 | <clickhouse> |
- 给数据表添加TTL策略, 默认去
default
, 15天以上的去cold_volume
1 | alter table database_name.table_name modify TTL create_time TO VOLUME 'default', create_time + INTERVAL 15 DAY TO VOLUME 'cold_volume' |
- 刷新TTL策略, 强制冷数据移动
1 | alter table database_name.table_name materialize ttl |
参考资料
Amplifying ClickHouse Capacity with Multi-Volume Storage (Part 1)
Amplifying ClickHouse Capacity with Multi-Volume Storage (Part 2)
Putting Things Where They Belong Using New TTL Moves 中文翻译,但是水平一般: 【ClickHouse 技术系列】- 使用新的 TTL move,将数据存储在合适的地方