Troubleshooting Data Governance

Q: SQL код-челлендж: таблица не найдена (Table not found)

SQL код-челленджи используют sql.js (SQLite в браузере). Тестовые таблицы создаются автоматически из раздела setup в конфигурации челленджа. Ошибка возникает при обращении к таблице с неверным именем или при использовании синтаксиса, несовместимого с SQLite. Проверьте имена таблиц в описании челленджа (раздел "Доступные таблицы") SQLite не поддерживает: FULL OUTER JOIN, RIGHT JOIN, некоторые оконные функции Используйте одинарные кавычки для строк, двойные -- для идентификаторов Если нужен ILIKE -- используйте LIKE с функцией LOWER(): WHERE LOWER(col) LIKE '%text%'

Q: JSON валидация: несоответствие схеме (Schema mismatch)

JSON-validator проверяет структуру строго: все обязательные поля должны присутствовать, типы значений должны совпадать (строка vs число), массивы должны содержать минимальное количество элементов. Лишние поля обычно допускаются, но пропущенные -- нет. Внимательно прочитайте описание ожидаемой структуры в задании Проверьте, что все обязательные поля указаны (required fields) Убедитесь, что типы данных совпадают: числа без кавычек, строки в кавычках Массивы: проверьте минимальное количество элементов ("rules" обычно >= 3) Для отладки: используйте JSON.parse() в консоли браузера для проверки синтаксиса

Question 1

Путаница между Data Governance и Data Management

Accepted Answer

Data Governance -- это набор политик, ролей и процессов, обеспечивающих правильное управление данными. Data Management -- это практическая реализация этих политик (ETL, хранение, бэкапы). Governance определяет правила, Management их выполняет. DMBOK2 чётко разделяет эти области. Governance = ЧТО и ЗАЧЕМ (политики, стандарты, роли, метрики) Management = КАК и КОГДА (инструменты, процессы, инфраструктура) Пример: Governance решает "все PII данные должны быть зашифрованы", Management реализует шифрование в конкретной СУБД Повторите урок 1 модуля M01 (Что такое Data Governance)

Question 2

Несоответствие терминов DMBOK2 (английский vs русский)

Accepted Answer

Курс использует DMBOK2 (русское издание, ISBN 978-5-9693-0404-8) как терминологический авторитет. Другие источники могут использовать иные переводы. Например: "Data Steward" = "Стюард данных" (не "Администратор данных"), "Data Lineage" = "Происхождение данных" (не "Линейность данных"). Все термины курса основаны на глоссарии DMBOK2 (русское издание) При первом использовании термин всегда даётся в формате: Русский Термин (English Term) Сверяйтесь с глоссарием курса через Cmd+K или страницу глоссария Если в квизе встречается незнакомый термин -- ищите его в глоссарии курса

Question 3

Ошибка интерпретации уровня зрелости governance

Accepted Answer

Модель зрелости использует 5 уровней: 1 (Initial/Ad-hoc), 2 (Managed), 3 (Defined), 4 (Quantitatively Managed), 5 (Optimizing). Общий уровень определяется средним арифметическим с округлением вниз (floor). Если хотя бы одно измерение ниже целевого -- общий уровень не может превышать среднее. Уровень зрелости = floor(среднее всех измерений) Проверьте каждое измерение: data quality, metadata, security, privacy, stewardship Для Level 3 нужно: все измерения >= 2, среднее >= 3.0 Повторите урок 5 модуля M01 (Бизнес-кейс и зрелость)

Question 4

Путаница ролей: Data Steward vs Data Owner vs Data Custodian

Accepted Answer

Data Owner -- бизнес-руководитель, ответственный за данные домена (принимает решения). Data Steward -- операционный эксперт, обеспечивающий качество и соответствие стандартам (выполняет политики). Data Custodian -- технический специалист, управляющий инфраструктурой хранения (поддерживает системы). Data Owner = ОТВЕЧАЕТ за данные (бизнес, стратегия, бюджет) Data Steward = УПРАВЛЯЕТ качеством данных (стандарты, метаданные, профилирование) Data Custodian = ОБСЛУЖИВАЕТ инфраструктуру (БД, бэкапы, доступы) Мнемоника: Owner решает ЧТО, Steward контролирует КАК, Custodian обеспечивает ГДЕ Повторите урок 3 модуля M01 (Организация governance)

Question 5

Timeout в Python код-челлендже (превышен лимит 10 секунд)

Accepted Answer

Pyodide runner имеет жёсткий лимит 10 секунд на выполнение. Типичные причины: бесконечный цикл (while True без break), вложенные циклы O(n^3) на больших данных, рекурсия без базового случая, print() в цикле (вывод замедляет выполнение). Проверьте циклы на наличие условия выхода Замените вложенные циклы на словари/множества для O(1) поиска Убедитесь, что рекурсия имеет базовый случай и глубина ограничена Удалите отладочные print() из циклов перед отправкой Все код-челленджи курса решаемы за < 2 секунды при правильном подходе

Question 6

SQL код-челлендж: таблица не найдена (Table not found)

Accepted Answer

SQL код-челленджи используют sql.js (SQLite в браузере). Тестовые таблицы создаются автоматически из раздела setup в конфигурации челленджа. Ошибка возникает при обращении к таблице с неверным именем или при использовании синтаксиса, несовместимого с SQLite. Проверьте имена таблиц в описании челленджа (раздел "Доступные таблицы") SQLite не поддерживает: FULL OUTER JOIN, RIGHT JOIN, некоторые оконные функции Используйте одинарные кавычки для строк, двойные -- для идентификаторов Если нужен ILIKE -- используйте LIKE с функцией LOWER(): WHERE LOWER(col) LIKE '%text%'

Question 7

JSON валидация: несоответствие схеме (Schema mismatch)

Accepted Answer

JSON-validator проверяет структуру строго: все обязательные поля должны присутствовать, типы значений должны совпадать (строка vs число), массивы должны содержать минимальное количество элементов. Лишние поля обычно допускаются, но пропущенные -- нет. Внимательно прочитайте описание ожидаемой структуры в задании Проверьте, что все обязательные поля указаны (required fields) Убедитесь, что типы данных совпадают: числа без кавычек, строки в кавычках Массивы: проверьте минимальное количество элементов ("rules" обычно >= 3) Для отладки: используйте JSON.parse() в консоли браузера для проверки синтаксиса

Question 8

YAML валидация: ошибка отступов (Indentation error)

Accepted Answer

YAML-validator чувствителен к отступам. Типичные ошибки: смешивание табов и пробелов (YAML допускает только пробелы), непоследовательные отступы (2 vs 4 пробела в одном файле), пропущенный пробел после двоеточия, неправильная вложенность списков. Используйте ТОЛЬКО пробелы (не табы) для отступов Выберите один размер отступа (2 пробела рекомендуется) и соблюдайте везде После каждого ":" должен быть пробел: "key: value", не "key:value" Элементы списка ("-") должны иметь тот же отступ, что и ключ родителя + 2 пробела Строки со спецсимволами оборачивайте в кавычки: "value: with colon"

Question 9

JavaScript sandbox: console.log вместо return

Accepted Answer

js-sandbox runner захватывает возвращаемое значение функции (return), а не вывод в console. console.log() выводит в лог для отладки, но не является результатом выполнения. Тесты проверяют именно return value. Убедитесь, что функция завершается оператором return с нужным значением console.log() можно использовать для отладки, но результат -- только через return Если нужно вернуть объект: return { key: value }, не console.log({ key: value }) Проверьте, что return находится внутри функции, а не на верхнем уровне

Question 10

Код-челлендж не появляется на странице урока

Accepted Answer

Несоответствие поля lessonSlug в JSON-файле квиза и фактического пути MDX-файла урока. Квиз привязывается к уроку через lessonSlug, и если путь не совпадает -- квиз не находится и не отображается. Проверьте lessonSlug в JSON файле квиза (без расширения .mdx) Формат lessonSlug: "module-dir/lesson-file" (например: "01-foundations/03-governance-organization") Убедитесь, что MDX файл существует по указанному пути в src/content/course/ Перезапустите dev-сервер после изменений в JSON файлах квизов

Question 11

Quality dimension scorer возвращает неожиданные результаты

Accepted Answer

Quality dimensions имеют строгие формулы. Completeness = (non-null values / total values) * 100. Accuracy проверяется по reference dataset. Freshness -- разница между current_timestamp и last_updated. Ошибки возникают при неправильном округлении, игнорировании пустых строк ("" vs NULL), или неверной обработке граничных случаев. Completeness: считайте NULL и пустые строки ('') как missing values Accuracy: сравнивайте с reference dataset case-insensitive (lower()) Freshness: используйте единый формат дат (ISO 8601), учитывайте timezone Округляйте до 2 десятичных знаков: round(value, 2) Повторите урок 1 модуля M04 (Измерения качества данных)

Question 12

Ошибки синтаксиса dbt test в YAML конфигурации

Accepted Answer

dbt использует специфическую YAML структуру для тестов. Частые ошибки: неправильная вложенность columns внутри models, пропуск обязательного поля name, неверный синтаксис custom test (config: severity: warn вместо правильного формата). Структура: models -> [name, columns -> [name, tests -> [...]]] Каждый test -- это либо строка ("not_null"), либо объект ({accepted_values: {values: [...]}}) Проверьте вложенность: columns на 2 уровня глубже, чем models severity указывается внутри config: {config: {severity: warn}} Повторите урок 5 модуля M04 (dbt quality tests)

Question 13

Great Expectations suite: валидация не проходит

Accepted Answer

Great Expectations использует декларативный подход: каждый expectation определяет ожидаемое свойство данных. Ошибки возникают при неправильных параметрах (mostly vs. strict), неверных пороговых значениях, или непонимании разницы между column-level и table-level expectations. mostly=0.95 означает "минимум 95% значений должны соответствовать" Без mostly -- проверка strict (100%) expect_column_values_to_not_be_null != expect_column_to_exist Для JSON-структуры suite: meta, expectations[], expectation_type, kwargs Повторите урок 6 модуля M04 (Great Expectations)

Question 14

PII классификатор: ложноположительные или ложноотрицательные срабатывания

Accepted Answer

PII-классификация в курсе использует rule-based подход (фиксированные паттерны, не ML). Ошибки: неполный набор паттернов (пропущены email, phone, passport), нечувствительность к регистру (Email vs email), ложноположительные из-за слишком широких паттернов (любое слово "name" помечается как PII). Проверьте полный список PII-паттернов: email, phone, ssn/inn, passport, address, birth_date, full_name Используйте case-insensitive matching: column_name.lower() Различайте: "product_name" (не PII) vs "customer_name" (PII) -- контекст важен Проверяйте и имя колонки, и содержимое (если доступно) Повторите урок 2 модуля M05 (Обнаружение PII)

Question 15

Consent validator: граничные случаи (частичное согласие, отзыв)

Accepted Answer

Consent management имеет несколько граничных случаев: согласие может быть partial (на одни цели дано, на другие нет), может быть отозвано (revoked -- дата отзыва позже даты согласия), может истечь (expired -- превышен срок действия). Все три случая должны обрабатываться отдельно. Проверяйте каждую цель (purpose) отдельно: marketing, analytics, third_party Статус consent: active (дано, не истекло, не отозвано), revoked, expired Приоритет: revoked > expired > active (отзыв перекрывает всё) Дата сравнения: consent_date < current_date < expiry_date для active Повторите урок 3 модуля M05 (Управление согласиями)

Question 16

Data masking: функция не сохраняет формат данных

Accepted Answer

Format-preserving masking должен сохранять структуру оригинальных данных. Email: j***@example.com (первая буква + маска + домен). Телефон: ***-***-1234 (маска + последние 4 цифры). ИНН: ********12 (маска + последние 2). Нарушение формата делает данные непригодными для тестирования. Email: сохраняйте первый символ, @, и домен: masking("john@mail.com") = "j***@mail.com" Телефон: сохраняйте последние 4 цифры: masking("89161234567") = "*******4567" ИНН/SSN: маскируйте всё кроме последних 2-4 символов Общее правило: длина результата = длина оригинала Повторите урок 4 модуля M05 (Маскирование данных)

Question 17

RBAC/ABAC конфликт: deny vs allow приоритет

Accepted Answer

В RBAC/ABAC при конфликте правил (одно разрешает, другое запрещает) применяется принцип deny-overrides: запрет всегда побеждает. Ошибки возникают при неправильной оценке порядка правил или непонимании наследования ролей (роль с deny на уровне группы перекрывает allow на уровне пользователя). Принцип: deny ВСЕГДА перекрывает allow (deny-overrides) Порядок оценки: 1) собрать все applicable rules, 2) если есть хотя бы один deny -- запретить RBAC: проверяйте все роли пользователя (прямые + наследованные) ABAC: оценивайте все атрибуты (subject, resource, action, environment) Повторите уроки 2-3 модуля M06 (RBAC и ABAC)

Question 18

Governance-диаграмма не отображается на странице урока

Accepted Answer

Governance-диаграммы (OrgChart, MaturityModel, ClassificationTree и др.) -- это React-компоненты, требующие client:load для гидрации в Astro. Если пропущена директива client:load, компонент рендерится только на сервере и не интерактивен. Другие причины: неправильный формат props (nodes вместо tree), пропущенные обязательные поля. Убедитесь, что в MDX-файле компонент использует client:load: <MaturityModel client:load ... /> Проверьте props: каждый компонент имеет специфические обязательные поля ClassificationTree: tree (не nodes!), OrgChart: nodes + connections Очистите кэш браузера и перезагрузите страницу В dev-режиме: перезапустите dev-сервер после изменений в MDX

Question 19

RegulationRef popover не появляется при наведении

Accepted Answer

RegulationRef использует createPortal для span-based popover (не div, чтобы не ломать inline HTML в MDX). Popover появляется при hover (desktop) или touch (mobile). Проблемы: z-index конфликт с другими элементами, overflow:hidden на родительском контейнере, или отсутствие client:load на компоненте. Проверьте, что RegulationRef импортирован и имеет client:load RegulationRef работает inline (внутри

) -- не оборачивайте в div Если popover обрезается: проверьте overflow CSS на родительских элементах На мобильных: используйте tap вместо hover

Question 20

Квиз-секция не отображается на странице урока

Accepted Answer

Квиз привязывается к уроку через lessonSlug в JSON-файле. Если lessonSlug не совпадает с путём MDX-файла, квиз не будет отображён. Также возможно: JSON-файл содержит ошибку валидации (Zod schema), или квиз пуст (0 вопросов). Проверьте lessonSlug в JSON: должен совпадать с путём MDX (без расширения) Пример: для урока course/01-foundations/03-governance-organization.mdx slug = "01-foundations/03-governance-organization" Убедитесь, что JSON валиден: node -e "require('./path/to/quiz.json')" Проверьте, что массив questions не пуст (min 1 вопрос требуется Zod-схемой)

Question 21

Прогресс не обновляется после завершения квиза

Accepted Answer

Прогресс сохраняется в localStorage браузера. Если localStorage переполнен, отключён, или используется приватный режим -- прогресс не сохраняется. Также: разные URL (с www и без) имеют разные localStorage хранилища. Проверьте localStorage: DevTools -> Application -> Local Storage Убедитесь, что браузер не в приватном режиме Используйте один и тот же URL (с или без www) для всех занятий Для сброса: очистите localStorage данного домена и пройдите квизы заново

Фильтр по области

Фильтр по категории

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Симптомы

Причина

Решение