Learning Platform
Глоссарий Troubleshooting
Урок 02.06 · 20 мин
Средний
Governance PoliciesStandardsCompliance

Политики и стандарты governance

Введение

Политики — это формальное выражение governance-решений. Без политик governance остаётся набором устных договорённостей, которые забываются, интерпретируются по-разному и не переживают смену команды. В этом уроке мы разберём иерархию governance-документов, научимся писать эффективные политики и рассмотрим, как обеспечить их реальное соблюдение.

Иерархия governance-документов

Governance-документы организованы в иерархию по уровню абстракции:

Принципы (Principles)
Политики (Policies)
Стандарты (Standards)
Процедуры (Procedures)

Различия уровней

УровеньВопросПримерКто утверждаетЧастота обновления
Data Principles (принципы данных)Почему?”Данные — актив организации”CEO / BoardРаз в 3-5 лет
Data Policy (политика данных)Что?”PII хранится не дольше 3 лет”Data CouncilРаз в год
Data Standards (стандарты данных)Как?“snake_case для всех таблиц”CDO / StewardsПо необходимости
ПроцедурыШаг за шагом”Откройте JIRA, выберите тип ‘Data Access Request‘“StewardsПо необходимости

Анатомия governance-политики

Каждая Data Policy (политика данных) должна содержать обязательные разделы:

Шаблон политики классификации данных DataTech
Версия: 1.0Владелец: VP Engineering (и.о. CDO)Статус: УтвержденаДата утверждения: 2025-01-15Пересмотр: Ежегодный
1. Цель политики
Определить правила классификации данных DataTech Solutions по уровням конфиденциальности для обеспечения защиты информации и соответствия 152-ФЗ.
2. Область применения
Политика применяется ко всем данным во всех системах DataTech: PostgreSQL, ClickHouse, Metabase, MinIO, Airflow. Включает данные в производственных, тестовых и аналитических средах.
3. Определения
Public -- данные, доступные без ограничений (каталог продуктов). Internal -- данные для сотрудников (KPI, метрики). Confidential -- данные, требующие авторизации (email, адреса клиентов). Restricted -- данные с максимальной защитой (платёжные данные, медицинские записи).
4. Правила классификации
R1: Все датасеты должны быть классифицированы в течение 30 дней после создания (severity: high). R2: Данные, содержащие PII, классифицируются как Confidential или Restricted (severity: critical). R3: Классификация пересматривается при изменении структуры данных или бизнес-контекста (severity: medium). R4: Неклассифицированные данные по умолчанию считаются Internal (severity: low).
5. Enforcement
Data Stewards проводят ежемесячный обзор новых датасетов. Автоматические проверки в каталоге данных сигнализируют о неклассифицированных таблицах старше 30 дней. Нарушения эскалируются в Data Council.
6. Исключения
Временные таблицы (префикс tmp_) и staging-таблицы (префикс stg_) исключены из обязательной классификации при условии удаления в течение 7 дней.

Требования к качественной политике

  1. Конкретность — “все данные с PII — конфиденциальные” лучше, чем “данные должны быть защищены”
  2. Измеримость — “классифицировать в течение 30 дней” лучше, чем “классифицировать своевременно”
  3. Enforcement — каждая политика должна содержать раздел о механизме контроля
  4. Исключения — явно указать, что НЕ покрывает политика
  5. Владелец — конкретное лицо, ответственное за политику
Проверка знанийKnowledge check
Почему политика DataTech включает раздел 'Исключения' для tmp_ и stg_ таблиц?
ОтветAnswer
Без исключений Data Stewards будут тратить время на классификацию временных таблиц, которые существуют несколько часов или дней. Это создаёт бюрократическую нагрузку без ценности. Явные исключения показывают, что политика продумана и учитывает реальные рабочие процессы. Важно: исключения имеют условие (удаление в 7 дней) -- если tmp_ таблица живёт дольше, она подпадает под политику.

Жизненный цикл политики

Политики не статичны — они проходят через жизненный цикл:

1. Черновик
2. Обсуждение
3. Утверждение
4. Внедрение
5. Мониторинг
6. Пересмотр

Типичные ошибки

ОшибкаПоследствиеРешение
Слишком абстрактная политикаНевозможно проверить соблюдениеКонкретные правила с числовыми критериями
Нет enforcementПолитика “на бумаге”Раздел enforcement с автоматизацией
Нет владельцаНикто не обновляетКонкретное лицо + дата пересмотра
Слишком много политикНикто не читает5-7 ключевых политик на Level 2-3
Нет исключенийБюрократическая нагрузкаЯвные исключения с условиями

Сценарий: DataTech формулирует первые политики

Сценарий: DataTech Solutions (ДатаТех Солюшенз)

Data Council DataTech определил 5 приоритетных политик для первого года:

  1. Data Classification Policy — классификация данных по уровням (см. шаблон выше)
  2. Data Access Policy — кто и как получает доступ к данным
  3. Data Retention Policy — сроки хранения по категориям
  4. Data Quality Policy — стандарты качества и мониторинг
  5. Naming Convention Standard — правила именования таблиц и столбцов

Почему 5, а не 47 (как у FinSecure)? На Level 1-2 лучше иметь 5 реально работающих политик, чем 47 декларативных.

Практика: валидация политики

В этом модуле вы встретите код-челлендж CC-03 (Governance Policy Template Validator): JSON-задание, в котором нужно создать валидный governance-документ со всеми обязательными разделами (policy_id, title, version, effective_date, owner, scope, definitions, rules, enforcement, review_schedule).

Отслеживание соответствия политикам

Как убедиться, что политики соблюдаются? Для каждой политики ведётся compliance checklist:

Compliance: политика классификации данных DataTech
  1. 01Все датасеты в PostgreSQL классифицированы
    0 из 200+ таблиц классифицированы
    Не соответствует
  2. 02Все датасеты в ClickHouse классифицированы
    dbt-модели без метаданных классификации
    Не соответствует
  3. 03PII-данные помечены как Confidential/Restricted
    Нет инвентаризации PII
    Не соответствует
  4. 04Steward проводит ежемесячный обзор
    Steward назначен, обзор не проводился
    ~Частично
  5. 05Автоматические проверки в каталоге
    Каталог ещё не развёрнут
    Неприменимо

Текущий статус DataTech показывает типичную картину для Level 1: политика утверждена, но compliance = 0%. Это нормально — enforcement приходит на этапах 4-5 жизненного цикла, после внедрения инструментов.

Для сравнения: ФинСекьюр Банк

FinSecure (Level 3) имеет 47 политик, но enforcement проверяется только на годовом аудите. Результат: compliance 85% для core banking (автоматизированные проверки) и 45% для микросервисов (ручные проверки). Урок для DataTech: лучше 5 политик с автоматическим enforcement, чем 47 с ежегодным аудитом.

Стандарты как реализация политик

Data Standards (стандарты данных) — это конкретные технические правила, реализующие политики:

Политика: "Все таблицы должны именоваться единообразно"

Стандарт: "Используйте snake_case для имён таблиц и столбцов"

Пример: customer_addresses (верно), customerAddresses (нарушение)

Примеры стандартов для DataTech:

СтандартПравилоПроверка
Namingsnake_case для таблиц и столбцовАвтоматизируемо
ДатыISO 8601 (2024-01-15T10:30:00Z)Автоматизируемо
NullNOT NULL по умолчанию, NULL — осознанное решениеАвтоматизируемо
PIIСтолбцы с PII маркируются комментарием -- PIIАвтоматизируемо
DocumentationКаждая таблица имеет описание в каталогеАвтоматизируемо

Ключевое правило: стандарт должен быть автоматизируемо проверяем. Если стандарт нельзя проверить автоматически, его соблюдение невозможно масштабировать.

Проверка знанийKnowledge check
FinSecure имеет 47 политик, а DataTech планирует только 5. Почему меньше политик может быть лучше на ранних этапах программы governance?
ОтветAnswer
Потому что каждая политика требует enforcement -- механизма контроля и ресурсов на мониторинг. С 2 Data Stewards DataTech физически не может обеспечить enforcement 47 политик. 5 приоритетных политик с автоматическим enforcement дадут больше ценности, чем 47 политик без контроля. FinSecure -- пример того, как количество политик не гарантирует их соблюдение: compliance 45% для микросервисов при 47 политиках.

Итоги

  • Governance-документы имеют иерархию: принципы -> политики -> стандарты -> процедуры
  • Качественная Data Policy (политика данных) конкретна, измерима, имеет enforcement и владельца
  • Жизненный цикл: черновик -> обсуждение -> утверждение -> внедрение -> мониторинг -> пересмотр
  • На Level 1-2 лучше 5 реально работающих политик, чем 47 декларативных
  • Стандарты должны быть автоматизируемо проверяемыми
  • Compliance checklist отслеживает реальное соблюдение каждой политики

Политики определяют правила, но некоторые типы данных требуют специализированных governance-процессов. Master Data (мастер-данные) — клиенты, продукты, поставщики — пересекают все домены и все политики. Дубликаты мастер-данных (DataTech обнаружила 15% дубликатов клиентов) подрывают quality, compliance и analytics одновременно. В следующем уроке мы изучим Master Data Management (MDM) — системный подход к управлению мастер-данными, включая архитектурные паттерны, golden record и правила выживания данных.

Проверьте понимание

Результат: 0 из 0
Аналитический
Вопрос 1 из 5. FinSecure Bank имеет 47 governance-политик, но compliance проверяется только раз в год на аудите. DataTech планирует начать с 5 политик. Какое преимущество подхода DataTech?

Закончили урок?

Отметьте его как пройденный, чтобы отслеживать свой прогресс

Войдите чтобы оценить урок

Прогресс модуля
0 из 7