Интеграция с gh-ost и pt-online-schema-change

В production-окружениях выполнение ALTER TABLE на больших таблицах — это риск. Стандартный ALTER TABLE блокирует таблицу, что означает downtime приложения на время выполнения операции. Для таблицы на 100GB это могут быть часы.

Онлайн-инструменты DDL (gh-ost, pt-online-schema-change) решают эту проблему, выполняя schema migrations без блокировки таблицы. Но они создают временные helper-таблицы, которые Debezium захватывает в binlog. Неправильная обработка этих таблиц приводит к дублированию данных в CDC-пайплайне или падению коннектора.

В этом уроке мы изучим, как безопасно интегрировать gh-ost и pt-online-schema-change с Debezium MySQL CDC, настроим фильтрацию helper-таблиц и разберём паттерны для zero-downtime DDL миграций.

Проблема DDL в CDC-окружениях

Standard ALTER TABLE: блокировка и downtime

-- Простая операция: добавление колонки
ALTER TABLE orders ADD COLUMN status VARCHAR(20);

Что происходит в MySQL:

Создание временной таблицы с новой схемой
Копирование всех строк из оригинальной таблицы
Table lock — приложение не может писать в таблицу
Rename — временная таблица заменяет оригинальную

Ghost Table Lifecycle (gh-ost)

CREATE
_orders_gho

COPY
data migration

T1-Tn

RENAME
cutover

Tn+1

DROP
cleanup

Tn+2

Debezium Perspective

Debezium видит в binlog:

T0: CREATE

CREATE TABLE _orders_gho (...)

CREATE TABLE _orders_ghc (...)

→ Schema history updated

T1-Tn: DATA

INSERT _orders_gho (copy)

INSERT/UPDATE/DELETE orders

INSERT _orders_gho (sync)

→ Filter SMT excludes _gho

Tn+1: RENAME

RENAME orders → _orders_old

RENAME _orders_gho → orders

→ New schema active

Tn+2: DROP

DROP _orders_old

DROP _orders_ghc

→ Schema history updated

Consumer Impact

РЕЗУЛЬТАТ:Consumers видят новую колонку автоматически после cutover.

С Filter SMT consumers получают только события от оригинальной таблицы orders. После cutover новая схема (с добавленной колонкой) применяется автоматически.

Важно: Consumers должны быть готовы к schema evolution (новые optional поля).

Проблемы:

Downtime: Для таблицы на 100GB — 1-2 часа блокировки
Replication lag: Slave реплики отстают на время миграции
Binlog flood: Огромный объём событий за короткое время
Application errors: Timeout, connection pool exhaustion

Danger

Production incident: ALTER TABLE на 500GB таблице

Разработчик запустил ALTER TABLE в production без согласования. Миграция заняла 6 часов. Приложение было недоступно всё это время. Итог: $500K потерь выручки, увольнение.

Урок: Всегда используйте онлайн-инструменты DDL для таблиц >10GB в production.

Online DDL: zero-downtime альтернатива

Онлайн-инструменты DDL выполняют миграцию без блокировки таблицы:

Создают копию таблицы с новой схемой (ghost/helper table)
Копируют данные порциями (chunked copy)
Синхронизируют изменения во время копирования
Атомарный rename в конце (блокировка на миллисекунды)

Результат: Приложение работает нормально, users не замечают миграцию.

Онлайн-инструменты DDL: gh-ost vs pt-osc

gh-ost (GitHub Online Schema Change Tool)

Архитектура: Triggerless, основан на чтении binlog.

gh-ost: Binlog-based Schema Change

orders
(original)

Application writes

_orders_gho
(new schema)

+ status column

_orders_ghc
(metadata)

gh-ost process

1. Copy Rows

chunk copy
1000 rows

2. Read Binlog

binlog events
INS/UPD/DEL

3. Apply Changes

sync to ghost

4. Cutover

atomic rename

Debezium: Filter gh-ost Tables

ВАЖНО:gh-ost создает временные таблицы, которые Debezium видит в binlog.

// Filter SMT для исключения helper tables

"transforms.Filter.condition":

"!value.source.table.matches('.*_(gho|ghc)$')"

Без фильтра consumers получат дублирующие события от orders и _orders_gho.

Принцип работы:

Создаёт _orders_gho (ghost table) с новой схемой
Создаёт _orders_ghc (changelog table) для метаданных миграции
Копирует данные из orders в _orders_gho порциями (по умолчанию 1000 строк)
Читает binlog параллельно с копированием
Применяет изменения из binlog к ghost table
Атомарный rename в конце: orders ↔ _orders_gho

Пример команды:

gh-ost \
  --host=mysql \
  --user=gh-ost \
  --password=ghp \
  --database=mydb \
  --table=orders \
  --alter="ADD COLUMN status VARCHAR(20)" \
  --assume-rbr \
  --allow-on-master \
  --exact-rowcount \
  --concurrent-rowcount \
  --chunk-size=1000 \
  --max-load=Threads_running=25 \
  --critical-load=Threads_running=50 \
  --default-retries=120 \
  --execute

Плюсы:

✅ Triggerless — не добавляет overhead на каждую запись
✅ Throttling — автоматическое замедление при высокой нагрузке
✅ Replica-aware — может читать binlog с реплики
✅ Pausable — можно приостановить и возобновить

Минусы:

❌ Не поддерживает foreign keys (нужно временно удалить)
❌ Читает тот же binlog, что и Debezium (удвоенная нагрузка)
❌ Требует binlog format ROW

pt-online-schema-change (Percona Toolkit)

Архитектура: Trigger-based.

pt-osc: Trigger-based Schema Change

orders
(original)

+ TRIGGERS

triggers

_orders_new
(new schema)

AFTER INSERT
→ INSERT _orders_new

AFTER UPDATE
→ REPLACE _orders_new

AFTER DELETE
→ DELETE _orders_new

1. Create + Triggers

setup

2. Copy Chunks

chunk copy

3. Rename

atomic swap

4. Cleanup

drop old

pt-osc Advantage: Foreign Keys

ПОДДЕРЖКА FK:pt-osc корректно обрабатывает таблицы с foreign keys.

gh-ost НЕ поддерживает foreign keys — нужно временно удалять FK constraints. pt-osc использует триггеры, которые соблюдают FK при копировании данных.

Debezium: Filter pt-osc Tables

// Filter SMT для pt-osc helper tables

"transforms.Filter.condition":

"!value.source.table.matches('.*_(new|old)$')"

Принцип работы:

Создаёт _orders_new с новой схемой
Создаёт триггеры на оригинальной таблице (INSERT/UPDATE/DELETE)
Копирует данные из orders в _orders_new порциями
Триггеры синхронизируют изменения автоматически
Атомарный rename в конце: orders → _orders_old, _orders_new → orders
Удаляет _orders_old

Пример команды:

pt-online-schema-change \
  --alter="ADD COLUMN status VARCHAR(20)" \
  --execute \
  --chunk-size=1000 \
  --max-load=Threads_running:25 \
  --critical-load=Threads_running:50 \
  h=mysql,u=pt-osc,p=ptp,D=mydb,t=orders

Плюсы:

✅ Поддерживает foreign keys (через trigger cascade)
✅ Не читает binlog (меньше нагрузка на binlog)
✅ Проще в отладке (triggers видны в MySQL)

Минусы:

❌ Trigger overhead — каждая запись вызывает 3 триггера
❌ Нельзя приостановить без удаления триггеров
❌ Triggers увеличивают binlog размер

Сравнительная таблица: gh-ost vs pt-osc

Характеристика	gh-ost	pt-online-schema-change
Механизм	Binlog reading	Triggers
Helper tables	`_gho`, `_ghc`	`_new`, `_old`
Foreign keys	❌ Не поддерживает	✅ Поддерживает
Binlog impact	Удвоенная нагрузка (читает + пишет)	Нормальная нагрузка
CDC event volume	Выше (события от ghost table)	Ниже (только оригинальная таблица)
Throttling	Встроенный, replica-aware	Ручная настройка
Pausable	✅ Да	⚠️ Требует удаления триггеров
Рекомендация для CDC	Если нет FK и Debezium читает реплику	Если есть FK или нужна меньшая нагрузка

Проверка знаний

В чём принципиальная разница между механизмами синхронизации изменений в gh-ost и pt-online-schema-change?

Ответ

gh-ost использует triggerless подход — он читает binlog параллельно с Debezium для синхронизации изменений в ghost table, что удваивает нагрузку на binlog I/O. pt-online-schema-change создаёт триггеры (INSERT/UPDATE/DELETE) на оригинальной таблице, которые автоматически копируют изменения в новую таблицу, добавляя overhead на каждую запись, но не создавая дополнительной нагрузки на binlog.

Warning

gh-ost удваивает binlog read нагрузку

Во время gh-ost миграции:

gh-ost читает binlog (для синхронизации изменений)
Debezium читает binlog (для CDC)

Если оба процесса читают с одного master сервера, binlog I/O удваивается. В AWS Aurora рекомендуется читать с reader instance.

Проблема Helper Tables в CDC

Что происходит без правильной конфигурации

Сценарий 1: Helper tables НЕ в table.include.list

{
  "name": "mysql-connector",
  "config": {
    "table.include.list": "mydb.orders,mydb.users",
    ...
  }
}

Запускаем gh-ost:

gh-ost --table=orders --alter="ADD COLUMN status VARCHAR(20)" --execute

Что происходит:

gh-ost создаёт _orders_gho и _orders_ghc
Binlog содержит события для этих таблиц
Debezium видит события для таблиц, которых нет в schema history
ERROR: Table _orders_gho not found in schema history topic
Connector crashes mid-migration 💥

Danger

Connector crash во время gh-ost миграции

Если helper tables не включены в capture pattern, коннектор упадёт с ошибкой missing table. Миграция продолжит выполняться, но CDC-пайплайн будет сломан до ручного вмешательства.

Предотвращение: Всегда используйте широкий capture pattern (mydb.*) или явно включайте helper tables.

Сценарий 2: Helper tables в table.include.list, но НЕ фильтруются

{
  "name": "mysql-connector",
  "config": {
    "table.include.list": "mydb.*",
    ...
  }
}

Что происходит:

Debezium захватывает события от orders, _orders_gho, _orders_ghc
Kafka получает топики:
- mysql-server.mydb.orders
- mysql-server.mydb._orders_gho
- mysql-server.mydb._orders_ghc
Consumers видят дублирующиеся данные (та же строка из orders и _orders_gho)
Downstream системы путаются: какая версия данных правильная?

Проблема: Helper tables — это временные артефакты миграции. Consumers не должны их видеть.

Pattern 1: Broad Capture + SMT Filter (Рекомендуется)

Стратегия:

Захватывать все таблицы широким паттерном (mydb.*)
Фильтровать helper table события перед отправкой в Kafka
Consumers видят только оригинальные таблицы

gh-ostRecommended

Binlog-based

+Triggerless — нет overhead на записи

+Автоматический throttling

+Pausable/resumable

−НЕ поддерживает Foreign Keys

−Удваивает binlog read нагрузку

Рекомендуется для CDC
(если нет FK)

pt-online-schema-change

Trigger-based

+Поддерживает Foreign Keys

+Не читает binlog (меньше I/O)

+Проще отладка (triggers видны)

−Trigger overhead на каждую запись

−Сложно приостановить

Используйте если есть FK

Feature Comparison

Feature	gh-ost	pt-osc
Mechanism	Binlog reading	Triggers
Helper tables	_gho, _ghc	_new, _old
Foreign Keys	Not supported	Supported
Binlog impact	2x read load	Normal
Pausable	Yes	Requires cleanup

Конфигурация с Filter SMT

{
  "name": "mysql-connector-with-ddl-tools",
  "config": {
    "connector.class": "io.debezium.connector.mysql.MySqlConnector",
    "database.hostname": "mysql",
    "database.port": "3306",
    "database.user": "debezium",
    "database.password": "dbz",
    "database.server.id": "184001",
    "database.server.name": "mysql-server",

    "table.include.list": "mydb.*",

    "snapshot.mode": "when_needed",
    "schema.history.internal.kafka.topic": "schema-changes.mysql-server",
    "schema.history.internal.kafka.bootstrap.servers": "kafka:9092",

    "transforms": "FilterHelperTables",
    "transforms.FilterHelperTables.type": "io.debezium.transforms.Filter",
    "transforms.FilterHelperTables.language": "jsr223.groovy",
    "transforms.FilterHelperTables.condition": "!value.source.table.matches('.*_(gho|ghc|new|old)$')"
  }
}

Разбор Filter SMT:

!value.source.table.matches('.*_(gho|ghc|new|old)$')

value.source.table — имя таблицы из Debezium event
.matches('...') — проверяет regex паттерн
_gho$ — gh-ost ghost table (например, _orders_gho)
_ghc$ — gh-ost changelog table (например, _orders_ghc)
_new$ — pt-osc новая таблица (например, _orders_new)
_old$ — pt-osc старая таблица после rename (например, _orders_old)
! — инвертирует условие (пропускает события, НЕ соответствующие паттерну)

Результат:

События от orders → PASS (отправляются в Kafka)
События от _orders_gho → FILTERED (отбрасываются)
События от _orders_ghc → FILTERED (отбрасываются)
События от _orders_new → FILTERED (отбрасываются)

Tip

Filter SMT работает до Kafka producer

Фильтрация происходит в Debezium connector до отправки в Kafka. Это экономит:

Kafka storage (отфильтрованные события не записываются)
Network bandwidth (не передаются по сети)
Consumer processing (consumers не видят лишние события)

Альтернатива (антипаттерн): Фильтрация в consumers — тратит ресурсы Kafka и сети.

Проверка знаний

Почему рекомендуется использовать широкий capture pattern с Filter SMT вместо явного перечисления таблиц при интеграции с gh-ost/pt-osc?

Ответ

При явном перечислении таблиц (table.include.list) helper tables (типа _orders_gho, _orders_new) не будут в списке. Когда DDL-инструмент создаст их, Debezium увидит события в binlog для таблиц, которых нет в schema history, и connector упадёт с ошибкой. Широкий pattern (mydb.*) захватывает все таблицы включая helper, а Filter SMT отбрасывает их события до отправки в Kafka.

Pattern 2: Dynamic Include List (альтернативный подход)

Когда использовать: Если нужен строгий контроль над конкретными таблицами в CDC пайплайне.

Workflow

1. До миграции: добавить helper tables в include list

{
  "name": "mysql-connector",
  "config": {
    "table.include.list": "mydb.orders,mydb.users,mydb._orders_gho,mydb._orders_ghc"
  }
}

2. Применить изменённую конфигурацию:

curl -X PUT http://localhost:8083/connectors/mysql-connector/config \
  -H "Content-Type: application/json" \
  -d @connector-config-with-helpers.json

3. Запустить gh-ost миграцию:

gh-ost --table=orders --alter="ADD COLUMN status VARCHAR(20)" --execute

4. После миграции: удалить helper tables из include list

{
  "name": "mysql-connector",
  "config": {
    "table.include.list": "mydb.orders,mydb.users"
  }
}

5. Применить конфигурацию снова.

Недостатки Dynamic Include List

❌ Требует ручного изменения конфигурации коннектора
❌ Риск забыть удалить helper tables после миграции
❌ Не подходит для автоматизированных DDL пайплайнов
❌ Helper table события всё равно попадают в Kafka

Вердикт: Используйте Pattern 1 (Broad Capture + Filter SMT) как default подход.

gh-ost Integration: полный walkthrough

Подготовка: Configure connector

{
  "name": "mysql-connector-ghhost",
  "config": {
    "connector.class": "io.debezium.connector.mysql.MySqlConnector",
    "database.hostname": "mysql",
    "database.port": "3306",
    "database.user": "debezium",
    "database.password": "dbz",
    "database.server.id": "184001",
    "database.server.name": "mysql-server",
    "table.include.list": "inventory.*",
    "snapshot.mode": "when_needed",
    "schema.history.internal.kafka.topic": "schema-changes.mysql-server",
    "schema.history.internal.kafka.bootstrap.servers": "kafka:9092",
    "transforms": "FilterHelperTables",
    "transforms.FilterHelperTables.type": "io.debezium.transforms.Filter",
    "transforms.FilterHelperTables.language": "jsr223.groovy",
    "transforms.FilterHelperTables.condition": "!value.source.table.matches('.*_(gho|ghc)$')"
  }
}

Шаг 1: Создать пользователя для gh-ost

CREATE USER 'gh-ost'@'%' IDENTIFIED BY 'ghp';
GRANT SELECT, INSERT, UPDATE, DELETE, CREATE, DROP, INDEX, ALTER,
      LOCK TABLES, TRIGGER, REPLICATION SLAVE, REPLICATION CLIENT
      ON inventory.* TO 'gh-ost'@'%';
FLUSH PRIVILEGES;

Шаг 2: Запустить gh-ost миграцию

gh-ost \
  --host=mysql \
  --port=3306 \
  --user=gh-ost \
  --password=ghp \
  --database=inventory \
  --table=orders \
  --alter="ADD COLUMN status VARCHAR(20) DEFAULT 'pending'" \
  --assume-rbr \
  --allow-on-master \
  --exact-rowcount \
  --concurrent-rowcount \
  --chunk-size=1000 \
  --max-load=Threads_running=25 \
  --critical-load=Threads_running=50 \
  --default-retries=120 \
  --postpone-cut-over-flag-file=/tmp/ghost.postpone.flag \
  --execute

Параметры:

--assume-rbr — предполагает binlog_format=ROW (необходимо для CDC)
--allow-on-master — разрешает работу на master (используйте --migrate-on-replica для replica-based миграции)
--chunk-size=1000 — копирует по 1000 строк за chunk
--max-load — приостанавливает при превышении нагрузки
--critical-load — прерывает при критической нагрузке
--postpone-cut-over-flag-file — позволяет задержать финальный rename (опционально)

Шаг 3: Мониторинг gh-ost процесса

gh-ost выводит прогресс в реальном времени:

Copy: 25000/100000 25.0%; Applied: 1234; Backlog: 5/100; Time: 2m30s(total), 8m20s(remaining)

Проверить в MySQL:

-- Проверить существование helper tables
SHOW TABLES LIKE '%gho%';

-- Проверить размер ghost table
SELECT
  TABLE_NAME,
  TABLE_ROWS,
  DATA_LENGTH
FROM information_schema.TABLES
WHERE TABLE_SCHEMA = 'inventory' AND TABLE_NAME LIKE '%gho%';

Шаг 4: Что происходит с Debezium

Во время миграции:

Debezium видит CREATE TABLE события для _orders_gho и _orders_ghc
Схемы этих таблиц записываются в schema history topic
Debezium захватывает INSERT/UPDATE/DELETE события для всех трёх таблиц
Filter SMT отбрасывает события от _orders_gho и _orders_ghc
Только события от оригинальной таблицы orders отправляются в Kafka

Проверить Debezium connector logs:

docker logs -f kafka-connect | grep "orders"

Ожидаемые логи:

INFO Creating topic 'mysql-server.inventory.orders'
INFO Processing CREATE TABLE for _orders_gho
INFO Processing CREATE TABLE for _orders_ghc
INFO Filtering event from _orders_gho (helper table)
INFO Processing event from orders

Шаг 5: Финальный rename (cut-over)

gh-ost выполняет атомарный rename:

RENAME TABLE
  `inventory`.`orders` TO `inventory`.`_orders_old`,
  `inventory`.`_orders_gho` TO `inventory`.`orders`;

Что происходит:

Обе таблицы блокируются на миллисекунды
Rename выполняется атомарно
Приложение продолжает работать с новой таблицей orders (бывшая _orders_gho)

В Debezium:

Schema history topic получает событие RENAME
Последующие события используют новую схему (orders с колонкой status)
Consumers видят новую колонку в CDC событиях

Шаг 6: Cleanup (автоматический)

gh-ost автоматически удаляет helper tables:

DROP TABLE IF EXISTS `inventory`.`_orders_old`;
DROP TABLE IF EXISTS `inventory`.`_orders_ghc`;

Debezium записывает DROP TABLE события в schema history.

Верификация после миграции

-- Проверить новую схему
DESCRIBE inventory.orders;
-- Должна быть колонка 'status'

-- Проверить, что helper tables удалены
SHOW TABLES LIKE '%gho%';
-- Empty set (0.00 sec)

-- Проверить данные
SELECT * FROM inventory.orders LIMIT 5;

Проверить Kafka consumer:

kafka-console-consumer \
  --bootstrap-server kafka:9092 \
  --topic mysql-server.inventory.orders \
  --from-beginning \
  --max-messages 5

Ожидаемый вывод: события с новой колонкой status.

Note

gh-ost не поддерживает foreign keys

Если таблица orders имеет foreign key к customers, gh-ost откажется выполнять миграцию:

FATAL Foreign key constraints are not supported. Run with --alter-foreign-keys-method=auto

Решения:

Временно удалить FK: ALTER TABLE orders DROP FOREIGN KEY fk_customer_id
Выполнить gh-ost миграцию
Восстановить FK: ALTER TABLE orders ADD CONSTRAINT fk_customer_id FOREIGN KEY (customer_id) REFERENCES customers(id)

Или используйте pt-online-schema-change (поддерживает FK).

pt-online-schema-change Integration: полный walkthrough

Подготовка: Configure connector

Та же конфигурация, но добавляем фильтр для pt-osc паттернов:

{
  "name": "mysql-connector-ptosc",
  "config": {
    "connector.class": "io.debezium.connector.mysql.MySqlConnector",
    "table.include.list": "inventory.*",
    "transforms": "FilterHelperTables",
    "transforms.FilterHelperTables.type": "io.debezium.transforms.Filter",
    "transforms.FilterHelperTables.language": "jsr223.groovy",
    "transforms.FilterHelperTables.condition": "!value.source.table.matches('.*_(new|old)$')"
  }
}

Шаг 1: Создать пользователя для pt-osc

CREATE USER 'pt-osc'@'%' IDENTIFIED BY 'ptp';
GRANT SELECT, INSERT, UPDATE, DELETE, CREATE, DROP, INDEX, ALTER,
      LOCK TABLES, TRIGGER, REPLICATION SLAVE, REPLICATION CLIENT
      ON inventory.* TO 'pt-osc'@'%';
FLUSH PRIVILEGES;

Шаг 2: Запустить pt-online-schema-change

pt-online-schema-change \
  --alter="ADD COLUMN priority INT DEFAULT 0" \
  --execute \
  --chunk-size=1000 \
  --max-load=Threads_running:25 \
  --critical-load=Threads_running:50 \
  --chunk-time=0.5 \
  --progress=time,30 \
  h=mysql,P=3306,u=pt-osc,p=ptp,D=inventory,t=orders

Параметры:

--chunk-size=1000 — копирует по 1000 строк за chunk
--max-load — приостанавливает при высокой нагрузке
--critical-load — прерывает при критической нагрузке
--chunk-time=0.5 — ограничивает время выполнения одного chunk (0.5 сек)
--progress=time,30 — выводит прогресс каждые 30 секунд

Шаг 3: Что делает pt-osc

1. Создаёт новую таблицу:

CREATE TABLE `inventory`.`_orders_new` LIKE `inventory`.`orders`;
ALTER TABLE `inventory`.`_orders_new` ADD COLUMN priority INT DEFAULT 0;

2. Создаёт триггеры:

-- Trigger for INSERT
CREATE TRIGGER `pt_osc_inventory_orders_ins`
AFTER INSERT ON `inventory`.`orders`
FOR EACH ROW
INSERT IGNORE INTO `inventory`.`_orders_new` (...) VALUES (...);

-- Trigger for UPDATE
CREATE TRIGGER `pt_osc_inventory_orders_upd`
AFTER UPDATE ON `inventory`.`orders`
FOR EACH ROW
REPLACE INTO `inventory`.`_orders_new` (...) VALUES (...);

-- Trigger for DELETE
CREATE TRIGGER `pt_osc_inventory_orders_del`
AFTER DELETE ON `inventory`.`orders`
FOR EACH ROW
DELETE IGNORE FROM `inventory`.`_orders_new` WHERE id = OLD.id;

3. Копирует данные chunk-by-chunk:

INSERT LOW_PRIORITY IGNORE INTO `inventory`.`_orders_new`
SELECT * FROM `inventory`.`orders`
WHERE id >= 1 AND id < 1001;

-- Следующий chunk
INSERT LOW_PRIORITY IGNORE INTO `inventory`.`_orders_new`
SELECT * FROM `inventory`.`orders`
WHERE id >= 1001 AND id < 2001;

4. Финальный rename:

RENAME TABLE
  `inventory`.`orders` TO `inventory`.`_orders_old`,
  `inventory`.`_orders_new` TO `inventory`.`orders`;

5. Удаляет старую таблицу:

DROP TABLE `inventory`.`_orders_old`;

Шаг 4: Что происходит с Debezium

Во время миграции:

Debezium видит CREATE TABLE _orders_new
Debezium видит CREATE TRIGGER события (записываются в schema history)
Каждая запись в orders генерирует 2 события:
- INSERT в orders (оригинальная операция)
- INSERT в _orders_new (через trigger)
Filter SMT отбрасывает события от _orders_new
Consumers видят только события от orders

После rename:

_orders_new становится orders
Debezium видит RENAME события
Schema history обновляется
Последующие события от новой таблицы orders содержат колонку priority

Верификация после миграции

-- Проверить новую схему
DESCRIBE inventory.orders;
-- Должна быть колонка 'priority'

-- Проверить, что триггеры удалены
SHOW TRIGGERS FROM inventory LIKE 'orders';
-- Empty set (0.00 sec)

-- Проверить, что _orders_old удалена
SHOW TABLES LIKE '%old%';
-- Empty set (0.00 sec)

Note

pt-osc поддерживает foreign keys

В отличие от gh-ost, pt-online-schema-change корректно обрабатывает таблицы с foreign keys. Триггеры автоматически применяют FK constraints.

Пример:

-- Таблица с FK
CREATE TABLE orders (
  id INT PRIMARY KEY,
  customer_id INT,
  FOREIGN KEY (customer_id) REFERENCES customers(id)
);

-- pt-osc успешно выполнит миграцию
pt-online-schema-change --alter="ADD COLUMN status VARCHAR(20)" ...

Триггеры будут соблюдать FK constraints при копировании данных.

Schema Evolution в Consumers

Что видят consumers после DDL

После успешной миграции (gh-ost или pt-osc), новая колонка появляется в CDC событиях:

До миграции:

{
  "schema": {
    "fields": [
      {"field": "id", "type": "int32"},
      {"field": "customer_id", "type": "int32"},
      {"field": "created_at", "type": "string"}
    ]
  },
  "payload": {
    "after": {
      "id": 1,
      "customer_id": 42,
      "created_at": "2026-02-01T10:00:00Z"
    }
  }
}

После миграции:

{
  "schema": {
    "fields": [
      {"field": "id", "type": "int32"},
      {"field": "customer_id", "type": "int32"},
      {"field": "created_at", "type": "string"},
      {"field": "status", "type": "string", "optional": true}
    ]
  },
  "payload": {
    "after": {
      "id": 2,
      "customer_id": 43,
      "created_at": "2026-02-01T10:05:00Z",
      "status": "pending"
    }
  }
}

Обработка schema evolution в consumers

Avro + Schema Registry (рекомендуется):

// Schema Registry автоматически обрабатывает backward/forward compatibility
GenericRecord record = reader.read();
String status = record.hasField("status")
  ? record.get("status").toString()
  : "unknown";

JSON Schema:

// Проверка на наличие поля
const status = event.payload.after.status || 'unknown';

Warning

Incompatible schema changes требуют координации

Некоторые DDL операции ломают consumers:

Breaking changes:

DROP COLUMN email — consumers ожидают поле, которого больше нет
CHANGE COLUMN id BIGINT — изменение типа может сломать десериализацию
RENAME TABLE orders TO sales — consumers слушают старый топик

Best practice workflow:

Deploy new consumer version (поддерживает обе схемы)
Выполнить DDL миграцию
Подождать, пока старые consumers обработают backlog
Deploy final consumer version (только новая схема)

Мониторинг DDL операций

Метрики для отслеживания

1. Connector health:

curl http://localhost:8083/connectors/mysql-connector/status | jq .connector.state
# Должно быть "RUNNING"

2. Schema history topic размер:

kafka-log-dirs --bootstrap-server kafka:9092 \
  --topic-list schema-changes.mysql-server \
  --describe | grep size

Во время DDL миграции размер должен увеличиться (новые DDL события).

3. Binlog lag:

SHOW SLAVE STATUS\G
-- Seconds_Behind_Master может вырасти во время gh-ost (читает binlog)

4. Kafka topic creation:

kafka-topics --bootstrap-server kafka:9092 --list | grep gho
# Во время gh-ost должны появиться топики для _orders_gho, _orders_ghc

5. После миграции: cleanup verification:

kafka-topics --bootstrap-server kafka:9092 --list | grep gho
# После успешной миграции helper table топики должны остаться (но без новых событий)

Алерты для настройки

# Prometheus AlertManager rules (пример)
groups:
  - name: debezium_ddl_monitoring
    rules:
      - alert: DebeziumConnectorFailedDuringDDL
        expr: |
          kafka_connect_connector_status{connector="mysql-connector",state="FAILED"} == 1
        for: 1m
        annotations:
          summary: "Debezium connector failed (possibly during DDL operation)"

      - alert: HelperTablesNotCleaned
        expr: |
          kafka_topic_partitions{topic=~".*_(gho|ghc|new|old)"} > 0
        for: 24h
        annotations:
          summary: "Helper table topics exist 24h after migration (investigate)"

Common Mistakes (частые ошибки)

1. Не включить helper tables в capture

Ошибка:

{
  "table.include.list": "inventory.orders,inventory.users"
}

Запускаете gh-ost на orders → connector crash:

ERROR: Table _orders_gho not found in schema history topic

Исправление:

{
  "table.include.list": "inventory.*"
}

2. Забыть фильтр SMT

Ошибка: Helper tables захватываются, но не фильтруются.

Последствия:

Consumers видят дублирующиеся события
Kafka storage расходуется на временные данные
Путаница в downstream системах

Исправление: Добавить Filter SMT (Pattern 1).

3. Запустить DDL во время snapshot

Ошибка: Debezium выполняет initial snapshot, администратор запускает gh-ost параллельно.

Последствия:

gh-ost блокирует таблицу для rename
Snapshot timeout (таблица заблокирована gh-ost)
Connector retry loop

Исправление: Дождитесь завершения snapshot, затем запускайте DDL.

4. gh-ost на таблице с FK

Ошибка:

gh-ost --table=orders --alter="..." --execute

orders имеет foreign key → gh-ost отказывается выполнять:

FATAL: Foreign key constraints are not supported

Исправление: Используйте pt-online-schema-change или временно удалите FK.

Hands-on Exercise: gh-ost с CDC

Prerequisites

MySQL лаборатория с Docker Compose
Debezium connector развёрнут с широким capture pattern
Filter SMT настроен

Exercise Steps

1. Проверить текущую схему:

DESCRIBE inventory.orders;

2. Deploy connector с Filter SMT:

curl -X POST http://localhost:8083/connectors \
  -H "Content-Type: application/json" \
  -d '{
    "name": "mysql-connector-ghhost",
    "config": {
      "connector.class": "io.debezium.connector.mysql.MySqlConnector",
      "database.hostname": "mysql",
      "database.port": "3306",
      "database.user": "debezium",
      "database.password": "dbz",
      "database.server.id": "184001",
      "database.server.name": "mysql-server",
      "table.include.list": "inventory.*",
      "snapshot.mode": "initial",
      "schema.history.internal.kafka.topic": "schema-changes.mysql-server",
      "schema.history.internal.kafka.bootstrap.servers": "kafka:9092",
      "transforms": "FilterHelperTables",
      "transforms.FilterHelperTables.type": "io.debezium.transforms.Filter",
      "transforms.FilterHelperTables.language": "jsr223.groovy",
      "transforms.FilterHelperTables.condition": "!value.source.table.matches('\''.*_(gho|ghc)$'\'')"
    }
  }'

3. Запустить gh-ost миграцию:

docker exec -it mysql bash

gh-ost \
  --host=127.0.0.1 \
  --user=root \
  --password=debezium \
  --database=inventory \
  --table=orders \
  --alter="ADD COLUMN status VARCHAR(20) DEFAULT 'pending'" \
  --assume-rbr \
  --allow-on-master \
  --exact-rowcount \
  --chunk-size=100 \
  --execute

4. Наблюдать connector logs:

docker logs -f kafka-connect | grep -E "(orders|gho|ghc)"

Ожидаемые логи:

INFO Creating topic for _orders_gho
INFO Filtering event from _orders_gho
INFO Processing event from orders

5. Проверить Kafka consumer (только orders события):

kafka-console-consumer \
  --bootstrap-server kafka:9092 \
  --topic mysql-server.inventory.orders \
  --from-beginning \
  --max-messages 10

6. Проверить schema history topic:

kafka-console-consumer \
  --bootstrap-server kafka:9092 \
  --topic schema-changes.mysql-server \
  --from-beginning \
  --property print.key=true \
  | grep -E "(gho|ALTER)"

Ожидаемый вывод: CREATE TABLE для _orders_gho, ALTER TABLE для orders.

7. Проверить новую схему после миграции:

DESCRIBE inventory.orders;
-- Должна быть колонка 'status'

8. Bonus: Проверить, что helper table топики пустые после миграции:

kafka-console-consumer \
  --bootstrap-server kafka:9092 \
  --topic mysql-server.inventory._orders_gho \
  --from-beginning \
  --max-messages 1 \
  --timeout-ms 5000

Если Filter SMT работает правильно: timeout (нет событий).

Summary: DDL Tools Checklist

Pre-migration:

Debezium connector настроен с широким capture pattern (mydb.*)
Filter SMT добавлен в конфигурацию коннектора
Regex фильтра покрывает все helper table паттерны (_gho, _ghc, _new, _old)
Connector status: RUNNING
Schema history topic retention: infinite (retention.ms=-1)

During migration:

Мониторинг connector logs (нет ошибок missing table)
Мониторинг binlog lag (может вырасти во время gh-ost)
Проверка Kafka topics (helper table топики создаются, но события фильтруются)

Post-migration:

Новая колонка появилась в CDC событиях
Schema history topic содержит DDL события (CREATE, ALTER, DROP)
Helper tables удалены из MySQL (SHOW TABLES не показывает _gho, _new)
Consumers обрабатывают события с новой схемой
Helper table топики в Kafka пустые (или могут быть удалены вручную)

Ключевые выводы

Standard ALTER TABLE блокирует таблицу — для больших таблиц это downtime на часы
gh-ost и pt-osc выполняют zero-downtime DDL — через helper tables и chunked copy
gh-ost triggerless, читает binlog — удваивает binlog read нагрузку, не поддерживает FK
pt-osc trigger-based — поддерживает FK, добавляет trigger overhead
Helper tables должны быть в table.include.list — иначе connector crash
Filter SMT — recommended pattern — фильтрует helper table события перед Kafka
Regex filter покрывает все паттерны — _gho, _ghc, _new, _old
Schema evolution автоматическая — новые колонки появляются в CDC событиях
Avro + Schema Registry упрощают schema evolution — backward/forward compatibility
Мониторинг connector logs критичен — детектирует проблемы во время миграции

Что дальше?

Мы разобрали интеграцию онлайн-инструментов DDL с Debezium MySQL CDC. Вы научились безопасно выполнять schema migrations без downtime и без дублирования данных в CDC-пайплайне.

В следующих уроках мы изучим advanced recovery сценарии: восстановление после потери binlog position, коррекция schema history topic, multi-connector deployments с управлением server.id conflicts, и incremental snapshots для добавления новых таблиц без остановки streaming.

Prerequisites:

Интеграция с gh-ost и pt-online-schema-change

Проблема DDL в CDC-окружениях

Standard ALTER TABLE: блокировка и downtime

Online DDL: zero-downtime альтернатива

Онлайн-инструменты DDL: gh-ost vs pt-osc

gh-ost (GitHub Online Schema Change Tool)

pt-online-schema-change (Percona Toolkit)

Сравнительная таблица: gh-ost vs pt-osc

Проблема Helper Tables в CDC

Что происходит без правильной конфигурации

Pattern 1: Broad Capture + SMT Filter (Рекомендуется)

Конфигурация с Filter SMT

Pattern 2: Dynamic Include List (альтернативный подход)

Workflow

Недостатки Dynamic Include List

gh-ost Integration: полный walkthrough

Подготовка: Configure connector

Шаг 1: Создать пользователя для gh-ost

Шаг 2: Запустить gh-ost миграцию

Шаг 3: Мониторинг gh-ost процесса

Шаг 4: Что происходит с Debezium

Шаг 5: Финальный rename (cut-over)

Шаг 6: Cleanup (автоматический)

Верификация после миграции

pt-online-schema-change Integration: полный walkthrough

Подготовка: Configure connector

Шаг 1: Создать пользователя для pt-osc

Шаг 2: Запустить pt-online-schema-change

Шаг 3: Что делает pt-osc

Шаг 4: Что происходит с Debezium

Верификация после миграции

Schema Evolution в Consumers

Что видят consumers после DDL

Обработка schema evolution в consumers

Мониторинг DDL операций

Метрики для отслеживания

Алерты для настройки

Common Mistakes (частые ошибки)

1. Не включить helper tables в capture

2. Забыть фильтр SMT

3. Запустить DDL во время snapshot

4. gh-ost на таблице с FK

Hands-on Exercise: gh-ost с CDC

Prerequisites

Exercise Steps

Summary: DDL Tools Checklist

Ключевые выводы

Что дальше?

Check Your Understanding

Finished the lesson?