Nimble Architecture

Parquet проектировался в 2013 году для аналитических workload’ов: десятки колонок, SQL-запросы, Hadoop MapReduce. Внутри Meta масштабы другие: AI/ML training таблицы с 10 000+ колонок (features, embeddings, метрики), где Parquet’s Thrift-based metadata становится узким горлом, а фиксированный набор кодировок ограничивает эффективность для новых типов данных.

Nimble — это C++ формат хранения, разработанный Meta (facebookincubator/nimble) как ответ на эти ограничения. Открыт в 2024 году (до этого — внутренний проект «Alpha»). Тесно интегрирован с Velox — execution engine Meta, используемым в Presto, Spark и внутренних ML pipeline’ах.

WARNING

Nimble находится на ранней стадии. Нет Python-биндингов, нет standalone-библиотеки — требуется сборка с Velox (gtest, glog, folly, abseil). Это не формат для самостоятельного использования, а компонент экосистемы Meta. Ценность для курса — архитектурные решения и философия дизайна.

NOTE

В Модуле 15 мы разобрали Lance и Vortex — два Rust-based формата с Arrow-native архитектурой. Nimble идёт другим путём: C++, привязка к Velox, философия «одна библиотека — один формат». В уроке 05 мы сравним все четыре подхода.

Мотивация: широкие таблицы Meta

Meta обрабатывает таблицы, структура которых радикально отличается от типичных OLAP-датасетов:

Структура таблиц: OLAP vs Meta AI/ML

OLAP-таблица

Характеристики

Meta AI/ML таблица

Характеристики

Конкретные проблемы Parquet для таблиц Meta:

Metadata bottleneck. Parquet использует Apache Thrift для сериализации метаданных. Thrift требует полного парсинга всего сообщения — нельзя прочитать metadata для одной колонки из 10 000 без десериализации всего блока. При 10K+ колонок это 50-200ms на row group только на metadata.
Фиксированные кодировки. Parquet поддерживает ~6 кодировок (PLAIN, DICTIONARY, RLE, DELTA_BINARY_PACKED, BYTE_STREAM_SPLIT, DELTA_LENGTH_BYTE_ARRAY). Добавление новой кодировки требует обновления спецификации, всех реализаций (Java, C++, Rust), совместимости. Meta хочет добавлять кодировки быстро.
Непредсказуемое потребление памяти. Parquet декодирует данные потоково (stream) — объём памяти зависит от размера page и паттерна кодирования. Для scheduler’а ML-pipeline, который должен разместить N декодеров на GPU/CPU cores, непредсказуемость — проблема.

Структура файла Nimble

Nimble организует данные в stripes (аналог row groups в Parquet), но с принципиально другой организацией внутри:

Структура файла Nimble

Nimble File

Footer размещён в конце файла — это позволяет writer’у записывать данные последовательно и финализировать метаданные одним write. Reader сначала читает footer (seek to end → read size → read footer), затем навигирует к нужным stripes.

Stripes, Streams и Blocks

Внутри каждого stripe данные организованы в streams. Каждая колонка представлена одним или несколькими streams (для nested типов — дополнительные streams для definition/repetition levels):

Внутренняя структура Stripe

Stripe

Stream: column_A

Stream: column_B

Stripe Footer (FlatBuffers)

Ключевое отличие от Parquet: блочная организация вместо страничной. В Parquet данные в page — это stream (произвольной длины), декодирование которого может потребовать непредсказуемый объём памяти. В Nimble block — это атомарная единица с известным размером decoded output.

FlatBuffers vs Thrift: доступ к метаданным

Выбор формата метаданных — одно из ключевых архитектурных решений Nimble:

Парсинг метаданных: Thrift (Parquet) vs FlatBuffers (Nimble)

Thrift (Parquet)

Парсинг 10K колонок

FlatBuffers (Nimble)

Парсинг 10K колонок

NOTE

FlatBuffers изобретены в Google для игровой индустрии (низкая latency), но идеально подходят для wide-schema метаданных. Nimble — не единственный формат с FlatBuffers: Vortex (Модуль 15) и F3 (урок 03) тоже используют FlatBuffers. Это тренд нового поколения форматов — уход от Thrift/Protobuf к zero-copy сериализации.

Block Encoding vs Stream Encoding

Главное архитектурное решение Nimble — блочное кодирование вместо потокового. Это напрямую влияет на предсказуемость потребления памяти:

Block Encoding (Nimble) vs Stream Encoding (Parquet)

Stream Encoding (Parquet)

Декодирование

Непредсказуемый memory footprint

Block Encoding (Nimble)

Декодирование

Предсказуемый memory footprint

Предсказуемость памяти — не теоретическое преимущество. В инфраструктуре Meta, где тысячи ML-training jobs конкурируют за GPU/CPU ресурсы, scheduler должен точно знать memory requirements каждого task. Block encoding делает decoding планируемым — как CPU instruction с известным latency.

Encoding Pipeline

Nimble использует рекурсивный, композируемый encoding pipeline. В отличие от Parquet, где кодировка выбирается на уровне page и применяется целиком, Nimble составляет цепочки кодировок:

Encoding Pipeline Nimble

Raw Column Data

Level 1: Structural Encoding

Level 2: Value Encoding

Level 3: Compression

Encoded Block

Рекурсивность означает, что каждый уровень может создавать sub-streams, которые проходят следующие уровни. Пример: Nullable(Dictionary(Delta(ZSTD(data)))) — nullable колонка с dictionary encoding, где indices закодированы delta + сжаты ZSTD.

TIP

Сравните с подходами других форматов: Parquet — фиксированный pipeline (encoding → compression, один уровень каждого). Vortex (Модуль 15) — cascading encodings с BtrBlocks-style selection. Nimble — рекурсивное дерево с произвольной глубиной. F3 (урок 03) — embedded Wasm decoders.

Интеграция с Velox

Nimble не существует как standalone библиотека — он тесно интегрирован с Velox, execution engine Meta:

Nimble в экосистеме Velox

Presto

Spark (Gluten)

ML Pipelines

Velox Engine

Connector

HDFS / S3 / Local FS

Tight coupling с Velox даёт преимущество в performance (нет conversion layer), но создаёт серьёзное ограничение: без Velox нельзя читать Nimble файлы. Нет standalone decoder, нет Python bindings, нет Java/Rust реализации.

Сравнение с Parquet: структура метаданных

Metadata Access: Parquet vs Nimble (10K колонок)

Stripe Layout: потоки данных

Каждый stripe содержит параллельные streams для каждой колонки. Для nested типов (struct, list, map) создаётся иерархия streams:

Streams внутри Stripe для nested типов

Root: struct<user_id: int64, features: list<float32>, metadata: map<string, string>>

Stream 0: user_id

Stream 1: features (list)

Stream 2: metadata (map)

Иерархия streams зеркалирует иерархию типов — в отличие от Parquet’s Dremel encoding, где nested types «размазываются» в плоские колонки с repetition/definition levels. Подход Nimble более прямолинейный: каждый уровень вложенности = отдельный stream. Это упрощает декодирование и делает его параллелизуемым.

Параллельное декодирование

Блочная архитектура Nimble обеспечивает предсказуемый параллелизм:

Параллельное декодирование Nimble

Velox Scheduler

Планирование

Core 0: stream A, blocks 0-3

Core 1: stream B, blocks 0-3

Core 2: stream A, blocks 4-7

Velox Vectors (decoded)

TIP

Ключевое отличие от Parquet: в Parquet scheduler не может точно узнать decoded size page до начала декодирования (зависит от dictionary size, RLE runs, null count). В Nimble block header содержит decoded_size — scheduler знает memory budget до первого байта декодирования.

Сравнение с форматами курса

Nimble в контексте форматов нового поколения

Итоги

Nimble — это целенаправленный ответ на конкретные проблемы Meta:

FlatBuffers metadata решает bottleneck Thrift при 10K+ колонках: O(1) random access вместо O(N) десериализации.
Block encoding обеспечивает предсказуемое потребление памяти: decoded size известен до начала декодирования. Scheduler точно планирует параллельное декодирование на N cores.
Рекурсивный encoding pipeline позволяет комбинировать кодировки произвольной глубины без изменения спецификации.
Tight coupling с Velox даёт performance (нет conversion layer), но ограничивает экосистему.

В следующем уроке мы разберём философию дизайна Nimble — подход «библиотека как спецификация», почему Meta осознанно отказывается от multi-implementation модели Parquet, и какие уроки из фрагментации Parquet-экосистемы привели к такому решению.

Nimble Architecture

Мотивация: широкие таблицы Meta

Структура файла Nimble

Stripes, Streams и Blocks

FlatBuffers vs Thrift: доступ к метаданным

Block Encoding vs Stream Encoding

Encoding Pipeline

Интеграция с Velox

Сравнение с Parquet: структура метаданных

Stripe Layout: потоки данных

Параллельное декодирование

Сравнение с форматами курса

Итоги

Закончили урок?