ACID-транзакции

ORC — immutable, ACID — Hive

Важнейшая архитектурная граница: ORC сам по себе — immutable формат. Файл ORC нельзя обновить на месте — он записывается один раз и только читается. Всё, что называется “ACID в ORC” — это Hive-уровневая абстракция, использующая ORC как storage substrate.

Hive ACID реализует INSERT, UPDATE, DELETE поверх immutable ORC-файлов через паттерн base + delta: исходные данные живут в base-файле, а изменения записываются в отдельные delta-директории. Чтение объединяет base и дельты через merge sort.

ACID — уровни абстракции

Что умеет ORC (формат)

Immutable файлы

Колоночное хранение

Индексы и статистики

Что добавляет Hive (runtime)

Base + Delta файлы

Row ID (скрытые колонки)

Compaction (minor / major)

Transaction Manager

WARNING

ORC — это формат хранения. ACID — это runtime-слой Hive. Если вы читаете ORC-файл напрямую через PyArrow или DuckDB, вы получаете raw данные без транзакционной семантики. Дельты, compaction и transaction visibility — ответственность Hive.

Структура директорий: base + delta

Hive ACID-таблица хранится на HDFS как набор директорий. Каждая транзакция создаёт новую delta-директорию:

Файловая структура ACID-таблицы

warehouse/db.db/transactions_table/

Директория	Содержимое	Когда создаётся
`base_NNNNNNN/`	Полный snapshot данных	Initial load или major compaction
`delta_MIN_MAX/`	Вставленные строки	INSERT, UPDATE (новая версия строки)
`delete_delta_MIN_MAX/`	Row IDs удалённых строк	DELETE, UPDATE (удаление старой версии)

NOTE

UPDATE в Hive ACID — это split operation: delete старой версии строки (запись в delete_delta) + insert новой версии (запись в delta). Поэтому одна UPDATE-операция создаёт две директории.

Row ID: уникальный идентификатор строки

Каждая строка в ACID-таблице имеет уникальный Row ID — составной ключ из трёх компонентов:

Структура Row ID

originalTransaction (writeId)

bucket (int32)

rowId (int64)

Row ID хранится как скрытые колонки в ORC-файле. Когда Hive записывает дельту, каждая строка содержит три служебных поля перед пользовательскими данными:

// Структура записи в ACID delta-файле
struct AcidRow {
 operation: int // 0=INSERT, 1=UPDATE, 2=DELETE
 originalTransaction: bigint // writeId создавшей транзакции
 bucket: int // номер bucket
 rowId: bigint // номер строки в bucket
 currentTransaction: bigint // writeId текущей транзакции
 // ... пользовательские колонки ...
}

TIP

Тройка (originalTransaction, bucket, rowId) — глобально уникальный идентификатор строки. Delete-дельта содержит только эти три поля — без пользовательских данных. При чтении ридер использует row ID для merge sort: находит строку в base/delta и проверяет, не удалена ли она в delete_delta.

Merge Sort при чтении

Чтение ACID-таблицы — это merge sort base и всех дельт:

Merge Sort при чтении ACID-таблицы

base_0000005

delta_0000006

delete_delta_0000008

Merge Sort по Row ID

Фильтрация удалённых + выбор последней версии

Результирующий набор строк

Алгоритм:

Открыть base-файл и все delta-файлы как отсортированные потоки по row ID
Merge sort всех потоков — строки приходят в порядке row ID
Для каждого row ID: проверить delete_delta — если row ID удалён, пропустить
Если несколько дельт содержат одинаковый row ID — взять версию с максимальным currentTransaction
Выдать результирующую строку

Compaction: объединение файлов

Со временем накапливаются десятки дельт — чтение замедляется. Compaction — фоновый процесс Hive Metastore, который объединяет файлы:

Minor и Major Compaction

Minor Compaction

delta_6_6

delta_7_7

delta_8_8

Minor compaction

delta_6_8

Быстрая: не трогает base
Base по-прежнему отдельно

Major Compaction

base_5

delta_6_8

Major compaction

base_0000008

Чистый snapshot, быстрое чтение
Дорогая: перезапись всех данных

Характеристика	Minor Compaction	Major Compaction
Что объединяет	Дельты между собой	Base + все дельты
Трогает base		(перезаписывает)
Delete-дельты	Сохраняются	Применяются и удаляются
Скорость	Быстрая	Медленная (полная перезапись)
Результат	Меньше дельт	Один чистый base
Когда нужна	Накопилось много мелких дельт	Накопилось много delete_delta

Transaction Visibility

Hive Metastore поддерживает Valid Transaction List — список завершённых (committed) транзакций. При чтении таблицы:

Транзакционная видимость

Запрос Valid Transaction List у Metastore

Фильтрация дельт по Valid Transaction List

Merge sort видимых base + delta

Snapshot Isolation (консистентный результат)

WARNING

Snapshot isolation в Hive ACID работает на уровне всей таблицы, не на уровне строк. Каждый запрос видит один snapshot. Конфликты записей (write-write) разрешаются через lock manager в Metastore — первая committed транзакция побеждает, конкурирующая — abort.

Ограничения Hive ACID

Hive ACID решает задачу UPDATE/DELETE на immutable storage, но имеет существенные ограничения:

Ограничения Hive ACID

Read Amplification

Только ORC

Compaction overhead

Не поддерживает MVCC

Hive ACID vs Delta Lake / Iceberg

Hive ACID — первая реализация ACID на immutable columnar storage. Современные форматы (Delta Lake, Apache Iceberg) развивают эту идею:

Характеристика	Hive ACID	Delta Lake	Apache Iceberg
Storage формат	Только ORC	Только Parquet	Parquet, ORC, Avro
Метаданные транзакций	Hive Metastore	_delta_log/ (JSON/Parquet)	metadata/ (Avro/JSON)
Time travel		(version/timestamp)	(snapshot ID/timestamp)
Schema evolution	Ограниченная		(полная)
Compaction	Фоновый (Metastore)	OPTIMIZE	Rewrite data files
Isolation	Snapshot (Metastore locks)	Optimistic concurrency	Optimistic concurrency

Ключевые выводы

ORC — immutable формат. ACID — это Hive-уровневый runtime, использующий ORC как storage substrate
Base + Delta паттерн: base-файл — snapshot, delta — вставки, delete_delta — удаления. UPDATE = delete + insert
Row ID (originalTransaction, bucket, rowId) — глобально уникальный идентификатор строки, хранится как скрытые ORC-колонки
Merge sort при чтении: все потоки объединяются по row ID, delete_delta фильтрует удалённые строки
Compaction: minor (дельты → одна дельта) и major (base + дельты → новый base)
Transaction visibility: через Valid Transaction List из Hive Metastore, snapshot isolation

Spark: lakehouse и эволюция от Hive ACID

ACID-транзакции

ORC — immutable, ACID — Hive

Что умеет ORC (формат)

Что добавляет Hive (runtime)

Структура директорий: base + delta

Row ID: уникальный идентификатор строки

Merge Sort при чтении

Compaction: объединение файлов

Minor Compaction

Major Compaction

Transaction Visibility

Ограничения Hive ACID

Hive ACID vs Delta Lake / Iceberg

Ключевые выводы

Закончили урок?