Строчное хранилище (row-based storage) хранит все значения столбцов одной записи вместе на диске. Столбцовое хранилище (columnar storage) группирует все значения одного столбца вместе по всем записям.
MySQL, PostgreSQLRow store layout:
[id=1, name="Alice", age=30] [id=2, name="Bob", age=25]
Apache Parquet, Amazon Redshift, ClickHouseColumn store layout:
[id: 1, 2] [name: "Alice", "Bob"] [age: 30, 25]
SUM или AVG по миллионам строк — с диска читаются только нужные столбцы, что резко снижает нагрузку на I/OКолончатое хранилище обычно достигает лучших коэффициентов сжатия, чем построчное хранилище, потому что соседние значения в одной колонке имеют одинаковый тип данных и часто содержат похожие значения.
Новый — ещё не проверен сообществом
Вы