Vortex Compressed Compute

В предыдущем уроке мы разобрали архитектуру Vortex: extensible encodings, layout tree, cascading compression. Теперь — главное преимущество: compressed compute — выполнение запросов без полной декомпрессии данных.

Традиционный pipeline: read → decompress → decode → compute. Vortex pipeline: read → compute on encoded. Разница — 5-20x по скорости и значительно меньший memory footprint.

White-Box Encodings

“White-box” — ключевой термин в архитектуре Vortex. В отличие от “black-box” компрессии (ZSTD, LZ4), где engine видит только compressed blob, Vortex encodings прозрачны для query engine:

Black-Box vs White-Box Encodings

Black-Box (Parquet + ZSTD)

Engine видит

Обязательный шаг

White-Box (Vortex)

Engine видит

Compressed compute

Compressed Compute Operations

Каждый encoding в Vortex предоставляет compute traits — набор операций, выполнимых без декомпрессии:

Compute Traits per Encoding

Encoding

Filter

Aggregate

Scan

Dictionary

RLE

Delta

ALP

Constant

Filter Pushdown в Storage

Vortex pushdown’ит фильтры внутрь encoding’а, не просто на уровень chunk statistics:

Filter Pushdown: три уровня глубины

WHERE country = 'DE' AND amount > 1000

Level 1: Chunk Stats

Chunk Pruning

Level 2: Encoding-Aware

Dictionary Filter

Level 3: Combine

Combined Bitmap

Late Materialization

Vortex использует late materialization — откладывает декодирование до последнего момента:

Late Materialization: decode откладывается

SELECT name, email WHERE country='DE' AND age > 30

Eager (Parquet)

Decode ALL

Late (Vortex)

Filter → Decode

TIP

Late materialization особенно эффективна для wide tables (50-100+ колонок) с selective predicates (filter отсекает >90%). Типичный OLAP сценарий: SELECT 3 колонки из 100 WHERE filter оставляет 1% строк. Eager: decode 100 × 1M. Late: filter на 2-3 encoded колонках → decode 3 × 10K. 1000x разница в decode work.

SIMD-Friendly Decode: FastLanes

Когда декомпрессия всё-таки нужна, Vortex использует FastLanes для максимальной скорости:

FastLanes: SIMD decode pipeline

BitPacked: 1M × 3 bits = 375KB

Scalar Unpack

FastLanes SIMD

Lane Layout

ARM NEON Support

FastLanes не привязан к x86. Поддержка ARM NEON для Apple Silicon и ARM серверов:

FastLanes: x86 vs ARM

x86 AVX-512

x86 AVX2

ARM NEON

GPU Direct Decode

Vortex спроектирован для GPU-прямого декодирования — данные передаются с storage на GPU минуя CPU:

GPU Decode Path (future)

Traditional: CPU decode

Pipeline

Vortex: GPU direct decode

Pipeline

WARNING

GPU direct decode — перспективная архитектура, не production feature текущей версии. NVIDIA GDS (GPUDirect Storage) доступен в CUDA 12+, но Vortex CUDA kernels — в разработке. Ценность: Vortex encodings (FastLanes bit operations) идеально маппятся на GPU SIMT architecture. Parquet encodings (dictionary lookup, RLE state machine) — плохо маппятся на GPU.

TPC-H Benchmarks

Результаты TPC-H SF100 (100GB), сравнение Parquet vs Vortex в DuckDB:

TPC-H SF100: Parquet vs Vortex

Scan Throughput

Compression Ratio

Write Speed

Random Access

Ключевые TPC-H queries:

TPC-H Query Speedups

Query

Характеристика

Parquet

Vortex

Q12

Parquet Compatibility Layer

Vortex обеспечивает обратную совместимость с Parquet через compatibility layer:

Parquet Compatibility: read + write

Read Parquet

Mapping

Write Parquet

Mapping

Vortex + Iceberg Integration

Ключевая интеграция: Vortex как data file format в Apache Iceberg tables:

Vortex + Iceberg: 4x ускорение

Iceberg Table (metadata layer)

Parquet files

Vortex files

Преимущества

NOTE

Vortex + Iceberg — самый практичный путь adoption. Команды не обязаны мигрировать весь data lake: новые партиции пишутся в Vortex, старые остаются в Parquet. Iceberg metadata управляет обоими форматами прозрачно. Это тот же паттерн, который использовал Parquet при вытеснении CSV — постепенная замена, не big-bang миграция.

Lance vs Vortex: позиционирование

Два формата атакуют Parquet с разных сторон:

Lance vs Vortex: разные задачи

Аспект

Lance

Vortex

Primary workload

Key innovation

Ecosystem

Compression

Production status

Итоги

Compressed compute — это не оптимизация, а архитектурный сдвиг:

Compressed Compute: paradigm shift

White-Box

Late Materialize

SIMD Decode

Iceberg Ready

В следующих уроках (Модуль 16) мы продолжим исследование next-gen форматов: Nimble (Meta, “library-as-spec” для Velox) и F3 (CMU, WASM-embedded decoders как SIGMOD 2025 research).