Learning Platform
Глоссарий Troubleshooting
Урок 05.09 · 3 мин
Средний
ИтогиMonitoringJMXOperations

Итоги модуля 4: Production Operations

Что вы изучили

В этом модуле вы освоили production operations: мониторинг, alerting и troubleshooting Debezium в реальных условиях.


Ключевые концепции

JMX Metrics

  • MilliSecondsBehindSource: Отставание от БД
  • MilliSecondsSinceLastEvent: Время без событий
  • QueueRemainingCapacity: Буфер событий

Alert Thresholds

  • Warning: lag > 30 секунд
  • Critical: lag > 5 минут
  • Queue: capacity < 20%

Prometheus/Grafana

  • JMX Exporter: Экспорт метрик
  • Dashboards: Визуализация lag и throughput
  • Alerting rules: Автоматические уведомления

Disaster Recovery

  • Snapshot re-trigger: signal.data.collection
  • Position reset: Откат к известной позиции
  • Schema recovery: Восстановление истории

Diagnostic Decision Tree

Диагностика: High Lag
High lag?
Queue full?
Increase max.queue.size
Slow consumers?
Check downstream
Source overload?
Snapshot in progress?
Network issues?
Check connectivity

Навыки

После прохождения модуля вы умеете:

  1. Интерпретировать JMX метрики Debezium
  2. Настроить Prometheus scraping
  3. Создать Grafana dashboards
  4. Настроить alerting rules
  5. Выполнить disaster recovery

Что дальше?

Модуль 5: SMT и Паттерны

Трансформации и продвинутые паттерны:

  • Single Message Transforms (SMT)
  • Outbox pattern для transactional messaging
  • Content-based routing
  • Schema Registry и Avro
JMX метрики Kafka: полный каталог для production мониторинга

Закончили урок?

Отметьте его как пройденный, чтобы отслеживать свой прогресс

Войдите чтобы оценить урок

Прогресс модуля
0 из 9