Tiered Storage

Традиционный Kafka-кластер хранит все данные локально на дисках брокеров. Это простое решение, но оно создаёт критическое ограничение: объём данных в кластере прямо пропорционален числу брокеров и размеру их дисков. Если вы хотите хранить месяц данных — нужны большие диски. Если хотите хранить год — нужно значительно масштабировать кластер.

Tiered Storage решает эту проблему, разделяя данные на горячий (local) и холодный (remote) уровни.

Проблема традиционного хранения

Рассмотрим типичный сценарий: production-кластер с топиком events, 10 ТБ данных за месяц, retention = 30 дней. При replication factor = 3:

Общий объём дисков = 10 ТБ * 3 реплики = 30 ТБ
Стоимость NVMe SSD (i3.8xlarge): ~$7.5/час * 3 брокера = $22.5/час
Годовая стоимость: ~$200 000

Большинство consumer-трафика приходится на последние часы или дни — «горячие» данные. Данные недельной давности читаются значительно реже. Тем не менее вы платите за хранение всех 30 ТБ на дорогостоящих SSD.

Архитектура Tiered Storage

Tiered Storage разделяет данные на два уровня:

Архитектура Tiered Storage

Producer

Local Tier (брокерские диски)

Remote Log Manager offloads

Remote Tier (S3/GCS/Azure Blob)

Consumer

Remote Log Manager

Remote Log Manager (RLM) — это компонент брокера, отвечающий за:

Offloading: перенос закрытых сегментов из local tier в remote tier
Metadata tracking: отслеживание, какие офсеты хранятся в remote tier (метаданные хранятся в internal Kafka топиках)
Fetch routing: при запросе consumer на offset в remote tier — скачивание сегмента из объектного хранилища и обслуживание запроса

RLM — это плагин-интерфейс (RemoteLogManagerPlugin). Confluent, AWS MSK и другие managed-решения предоставляют реализации для S3, GCS и Azure Blob Storage.

local.log.retention.ms и local.log.retention.bytes

Ключевые параметры tiered storage:

Параметр	Описание
`remote.log.storage.enable`	Включить tiered storage для топика
`local.log.retention.ms`	Как долго хранить данные локально. Старше — переносятся в remote
`local.log.retention.bytes`	Максимальный локальный объём партиции. При превышении — offload
`remote.log.delete.on.disable`	Удалять ли данные из remote tier при отключении tiered storage

Пример конфигурации для топика с 7-дневной глобальной retention и 12-часовой локальной:

kafka-configs.sh --bootstrap-server localhost:9092 \
  --entity-type topics \
  --entity-name events \
  --alter \
  --add-config \
  "remote.log.storage.enable=true,\
   local.log.retention.ms=43200000,\
   log.retention.ms=604800000"

Данные старше 12 часов автоматически переносятся в S3 (или другое remote хранилище). Глобальный retention 7 дней контролирует, когда данные удаляются из remote tier.

Путь чтения (Fetch Path)

Когда consumer запрашивает данные:

Брокер определяет, в каком tier находится запрошенный offset
Если offset в local tier → обычное чтение с диска (задержка: единицы миллисекунд)
Если offset в remote tier → RLM скачивает нужный сегмент из объектного хранилища, буферизует и возвращает данные (задержка: 100-500 мс в зависимости от размера сегмента и сети)

NOTE

Consumer-код не меняется — он делает обычные FetchRequest. Брокер сам определяет, где лежат данные, и прозрачно обслуживает запрос. Клиенту не нужно знать, что часть данных хранится в S3.

Cost vs Latency Trade-off

Tiered Storage — это компромисс:

Local vs Remote: стоимость и задержка

Local Tier

Remote Tier (S3)

Для большинства production-сценариев:

Local retention = 2-24 часа — достаточно для большинства consumer lag’ов
Remote retention = 7-90 дней — полная история в объектном хранилище
Экономия = 60-80% стоимости брокерских дисков при сохранении полной истории

Статус: production с Kafka 3.6

Tiered Storage стало production-ready в Kafka 3.6 (2023-10). В Kafka 4.0 (2025-03) feature получил значительные улучшения:

Поддержка KRaft без ZooKeeper (ZK-режим не поддерживался в tiered storage)
Улучшенное восстановление брокера с remote tier
Пониженная задержка fetch для remote segments

На 2026-04, Kafka 4.2 (latest stable) включает полностью зрелый tiered storage. Managed-решения: AWS MSK с S3, Confluent Cloud с встроенным tiered storage, Aiven for Apache Kafka.

TIP

Не используйте tiered storage для compacted топиков — compaction и tiered storage имеют сложное взаимодействие, особенно в части tombstone retention. По состоянию на Kafka 4.2 это ограничение постепенно снимается, но в production рекомендуется проверить release notes своей версии.

Проверка знанийKnowledge check

Команда хочет уменьшить local.log.retention.ms с 24 часов до 1 часа для экономии на дисках. Какой риск это создаёт для consumer-ов с типичным lag в 30 минут?

ОтветAnswer

При local.log.retention.ms=1 час данные старше 1 часа перемещаются в remote tier. Consumer с lag 30 минут обычно находится в пределах local tier — чтения быстрые. Однако при увеличении lag сверх 1 часа (из-за инцидента, перезагрузки, пиковой нагрузки) consumer начнёт читать из remote tier. Задержка fetch вырастет с единиц миллисекунд до 100-500 мс. Это может привести к каскадному эффекту: slow fetch → дальнейшее накопление lag → consumer не успевает сократить отставание. Рекомендация: устанавливать local.log.retention.ms как минимум в 2-3x от допустимого максимального consumer lag.

Tiered Storage

Проблема традиционного хранения

Архитектура Tiered Storage

Remote Log Manager

local.log.retention.ms и local.log.retention.bytes

Путь чтения (Fetch Path)

Cost vs Latency Trade-off

Статус: production с Kafka 3.6

Закончили урок?