Table Services и экосистема

В предыдущих уроках мы разобрали внутреннюю архитектуру Hudi: timeline, COW vs MOR, индексы, concurrency control, запросы. Этот урок завершает модуль двумя темами: Table Services — фоновые операции обслуживания таблицы, и экосистема — интеграции с движками, форматами и инструментами.

Table Services — это то, что делает Hudi self-managing: вместо ручного запуска OPTIMIZE/VACUUM (как в Delta Lake), Hudi может выполнять cleaning, compaction и clustering автоматически, в фоновом режиме, параллельно с ingestion.

NOTE

В Уроке 04 мы видели, что async table services — это один из multi-writer сценариев. Compaction и clustering запускаются как отдельные writer’ы и координируются через OCC или NBCC. Это прямое следствие архитектуры concurrency control.

Три Table Service

Hudi предлагает три основных сервиса обслуживания таблицы, каждый решает свою проблему:

Три Table Services Hudi

Compaction

Cleaning

Clustering

Compaction (MOR)

Compaction — критический сервис для MOR-таблиц. Без compaction, log files накапливаются и snapshot query замедляется, потому что каждый FileSlice требует merge всё большего количества log файлов.

Compaction: merge logs → base

До compaction

compaction

После compaction

Стратегии compaction

BoundedIO

UnBoundedIO

LogFileSizeBasedCompaction

DayBasedCompaction

Inline vs Async compaction

# Inline compaction (внутри writer процесса)
hoodie.compact.inline=true
hoodie.compact.inline.max.delta.commits=5
# Compaction запускается каждые 5 deltacommits
# Простота: один процесс. Минус: замедляет ingestion.

# Async compaction (отдельный процесс)
hoodie.compact.inline=false
# Compaction запускается отдельным Spark/Flink job
# Параллельно с ingestion. Требует multi-writer (OCC/NBCC).

TIP

Для production рекомендуется async compaction: отдельный Spark-job по расписанию. Inline compaction замедляет ingestion pipeline — каждые N deltacommits writer останавливается для compaction. Async compaction работает параллельно, не влияя на latency записи.

Cleaning

Cleaning удаляет устаревшие FileSlice, которые больше не нужны reader’ам. Это аналог VACUUM в Delta Lake:

Cleaning: удаление устаревших FileSlice

FileGroup fg-001

cleaning

FileGroup fg-001 (cleaned)

Cleaning policies

# Сколько commit'ов сохранять (по умолчанию: 10)
hoodie.cleaner.commits.retained=10

# Policy: KEEP_LATEST_COMMITS — хранить N последних commit'ов
hoodie.cleaner.policy=KEEP_LATEST_COMMITS

# Policy: KEEP_LATEST_FILE_VERSIONS — хранить N версий каждого файла
hoodie.cleaner.policy=KEEP_LATEST_FILE_VERSIONS
hoodie.cleaner.fileversions.retained=3

# Inline cleaning (каждый commit)
hoodie.clean.automatic=true

# Async cleaning (отдельный процесс)
hoodie.clean.automatic=false

WARNING

Cleaning необратим: удалённые FileSlice нельзя восстановить. Time travel на commit’ы до cleaning невозможен. Устанавливайте hoodie.cleaner.commits.retained исходя из требований к time travel и incremental query depth.

Clustering

Clustering реорганизует physical layout данных для оптимизации read performance. Это аналог OPTIMIZE + Z-ORDER в Delta Lake:

Clustering: реорганизация layout

До clustering

clustering

После clustering

Parquet Binary Copy: 10-15x ускорение

В Hudi 1.0 появилась оптимизация Parquet Binary Copy для clustering и compaction:

Parquet Binary Copy

Без Binary Copy

С Binary Copy (Hudi 1.0)

NOTE

Parquet Binary Copy особенно эффективен для compaction MOR-таблиц с малым количеством изменений: если log files затрагивают 1% записей в base file, 99% row groups копируются бинарно. Это делает compaction практически бесплатной для hot-partition / cold-data сценариев.

XTable: Multi-Format Interop

Apache XTable (incubating) — проект, позволяющий конвертировать метаданные между Hudi, Delta Lake и Iceberg без копирования данных:

XTable: cross-format interop

Hudi Table (source)

XTable sync

+ Delta metadata

+ Iceberg metadata

XTable работает in-place: не копирует данные, а генерирует дополнительные метаданные рядом с существующими. Одни и те же Parquet файлы читаются через Hudi connector, Delta connector или Iceberg connector — в зависимости от метаданных, которые видит движок.

# XTable CLI: sync Hudi → Delta + Iceberg
java -jar xtable-utilities.jar \
 --source-format HUDI \
 --target-formats DELTA,ICEBERG \
 --table-base-path s3://bucket/hudi_table/ \
 --sync-mode INCREMENTAL

TIP

XTable решает ту же проблему, что UniForm в Delta Lake: multi-engine access без дублирования данных. Разница: UniForm встроен в Delta (автоматическая генерация Iceberg metadata при commit), а XTable — внешний инструмент, работающий с любым из трёх форматов как source.

Интеграция с движками

Hudi поддерживает Spark, Flink, Presto и Trino как основные движки. Начиная с версии 1.0, все четыре движка — равноправные:

Матрица совместимости движков

Apache Spark

Apache Flink

Presto / Trino

hudi-rs (Python)

Hudi 1.0 Feature Matrix

Hudi 1.0 (GA декабрь 2024) — крупнейший релиз в истории проекта. Ключевые новые features:

Hudi 1.0: новые возможности

NBCC

Secondary Indexes

Partial Updates

LSM Timeline

Record Index

Binary Copy

Сравнение с Delta Lake и Iceberg

Table Services: Hudi vs Delta Lake vs Iceberg

Delta Lake

Apache Iceberg

Apache Hudi

Ключевое отличие Hudi

Hudi — единственный из трёх форматов, где table services встроены в runtime как первоклассные операции. Delta Lake и Iceberg рассматривают compaction/vacuum как отдельные команды, запускаемые пользователем. Hudi рассматривает их как автоматические сервисы, координируемые с ingestion через timeline.

Итоговое сравнение трёх форматов

Delta Lake

Apache Iceberg

Apache Hudi

Практические рекомендации

TIP

Compaction: для MOR-таблиц с high-throughput ingestion используйте async compaction отдельным job’ом. Для low-throughput — inline с hoodie.compact.inline.max.delta.commits=5. Без compaction MOR read деградирует.

Cleaning: включайте hoodie.clean.automatic=true для production. Устанавливайте hoodie.cleaner.commits.retained исходя из требований time travel (30 = ~30 batch’ей). Не отключайте — storage будет расти бесконтрольно.

Clustering: запускайте для таблиц с point queries (WHERE region = ‘EU’). Сортировка по query-колонкам улучшает data skipping. Для scan-heavy workloads (full-table aggregation) clustering менее полезен.

XTable: используйте для миграции между форматами или для multi-engine доступа (Hudi write, Presto read через Iceberg). Incremental sync — раз в N commit’ов.

Итоги

Table Services — compaction (MOR: merge logs → base), cleaning (удаление старых FileSlice), clustering (реорганизация layout). Hudi — единственный формат с встроенным async scheduling.
Parquet Binary Copy (1.0): 10-15x ускорение compaction/clustering за счёт бинарного копирования row groups без десериализации.
XTable (incubating): конвертация метаданных Hudi ↔ Delta ↔ Iceberg без копирования данных. Аналог UniForm, но внешний и двунаправленный.
Движки: Spark (полная поддержка), Flink (streaming-first), Presto/Trino (read-only), hudi-rs (Python read-only).
Hudi 1.0: NBCC, secondary indexes, partial updates, LSM timeline, record index, binary copy — крупнейший релиз, выравнивающий Hudi с Delta Lake и Iceberg по feature parity.
Hudi сильнее всего в инкрементальной обработке (5 типов запросов, checkpoint ETL) и self-managing (async table services). Слабее в Python-экосистеме (read-only hudi-rs vs read+write deltalake/pyiceberg).

Table Services и экосистема

Три Table Service

Compaction (MOR)

Стратегии compaction

Inline vs Async compaction

Cleaning

Cleaning policies

Clustering

Parquet Binary Copy: 10-15x ускорение

XTable: Multi-Format Interop

Интеграция с движками

Hudi 1.0 Feature Matrix

Сравнение с Delta Lake и Iceberg

Ключевое отличие Hudi

Практические рекомендации

Итоги

Закончили урок?