Severity и thresholds: error_if, warn_if

В junior уроке вы видели basic severity: error (default) или warn. На middle нужна granular control: ‘0-5 violations OK, 6-20 warn, 20+ error’, + per-environment tuning, + tag-based selectors, + incident response.

dbt тестам это даёт через error_if / warn_if thresholds + Jinja в config. Этот урок — production-grade тюнинг, начиная с tag-based selectors и заканчивая incident response workflow.

Уже знаешь из dbt-i?

Базовая severity: error | warn и семантика error_if/warn_if (counter-based thresholds) разбирались в dbt-i/07/03. Здесь — production tuning и incident workflow.

Recap semantics в одной таблице

Count of failures	severity: error (default)	severity: error + warn_if:“>10”, error_if:“>100”
0	pass	pass
1-10	error (CI blocked)	pass (below warn_if)
11-100	error	warn (CI passes)
101+	error	error (CI blocked)

Идея graduated response: терпимость к маленькому шуму, alert на средний уровень, block CI на серьёзный.

Tag-based selectors: критично для middle

Это первый production-инструмент, которым пренебрегают junior-команды. Без тегов любой PR прогоняет весь test suite — на крупных проектах это 10-30 минут. С тегами PR-CI проверяет только critical, остальное — на ночных runs.

columns:
  - name: order_id
    data_tests:
      - unique:
          config:
            tags: ['critical', 'pk']
      - not_null:
          config:
            tags: ['critical']
  - name: revenue
    data_tests:
      - dbt_expectations.expect_column_mean_to_be_between:
          min_value: 50
          max_value: 200
          config:
            tags: ['statistical', 'monitoring']
            severity: warn
            warn_if: ">5"

Production-расписание:

Когда	Selector	Цель
PR CI	`--select tag:critical`	< 2 минут, gate merge
Daily 02:00	`--exclude tag:statistical`	полный quality check
Weekly	(без selector)	вся suite, включая statistical

Принцип: tag = роль теста, не модель. Тег critical живёт на PK/FK/business-invariants. Тег statistical — на drift-checkах с natural variance. Тег monitoring — non-blocking observability.

Real use cases

Statistical tests (natural noise)

- dbt_expectations.expect_column_mean_to_be_between:
    min_value: 50
    max_value: 200
    config:
      severity: error
      warn_if: ">1"  # any violation = warn
      error_if: ">5"  # 5+ violations = error

Statistical naturally flaky. Tolerance prevents false positives.

Business rule violations

- premium_tier_revenue_threshold:
    min_revenue: 10000
    config:
      severity: error
      warn_if: ">5"  # 5+ premium customers без enough revenue — warn
      error_if: ">50"  # 50+ — real problem

5-50: investigate but not block deploys. 50+: structural problem, block.

Data quality on imperfect sources

columns:
  - name: customer_email
    data_tests:
      - dbt_expectations.expect_column_values_to_match_regex:
          regex: '^[\\w._%+-]+@[\\w.-]+\\.[A-Za-z]{2,}$'
          config:
            severity: warn
            warn_if: ">100"  # 100+ malformed emails — concerning
            error_if: ">1000"  # 1000+ — severe

Some emails always malformed (user input). Tolerance до threshold.

Freshness/recency

- dbt_expectations.expect_table_row_count_to_be_between:
    min_value: 100
    max_value: 50000
    config:
      where: "date = current_date - 1"
      severity: warn
      error_if: ">5"  # 5+ days with bad row count = systematic issue
      warn_if: ">2"

One bad day OK. Five — pattern needs attention.

Threshold operators

Beyond >, support:

config:
  warn_if: ">10"  # default
  error_if: "between 100 and 1000"

Supported operators (depending on dbt version):

Operator	Example	Meaning
`>`	`">10"`	strict greater than
`>=`	`">=10"`	greater than or equal
`<`	`"менее 10"`	strict less than
`between`	`"between 1 and 5"`	inclusive range

- not_null:
    config:
      warn_if: ">0"  # any null — warn
      error_if: ">=10"  # 10+ — error

Severity per environment

Often dev vs prod have different tolerance.

Per-target severity:

- dbt_expectations.expect_column_mean_to_be_between:
    min_value: 50
    max_value: 200
    config:
      severity: "{{ 'warn' if target.name == 'dev' else 'error' }}"

Dev — warn (just observation). Prod — error (block deploys).

Jinja в config — dynamic per-environment.

Per-target thresholds:

- not_null:
    config:
      severity: error
      error_if: "{{ '>1000' if target.name == 'dev' else '>100' }}"
      warn_if: "{{ '>100' if target.name == 'dev' else '>10' }}"

Dev — looser tolerance. Prod — strict.

Or через vars:

- not_null:
    config:
      severity: error
      error_if: ">{{ var('null_threshold', 100) }}"

dbt test --vars 'null_threshold: 1000'  # custom threshold per run

Incident response: severity warn навечно — antipattern

Измерения качества данных — что стоит за error_if/warn_if

Реальный сценарий: тест на дубликаты упал, кто-то поставил severity: warn чтобы разблокировать deploy. Прошло 6 месяцев. Дубликаты копятся, downstream marts молча неправильные.

Tuning workflow для теста, который упал:

Day 0 — тест упал в CI. Не ставить severity: warn! Открыть incident-ticket, оставить CI красным.
Day 0-1 — investigation: store_failures: true, найти root cause.
Day 1-3 — fix (см. урок 03 этого модуля).
Day 3 — CI снова зелёный, тест на severity: error.

Если fix невозможен срочно (зависит от source-команды), есть time-bounded warn pattern:

- unique:
    config:
      severity: "{{ 'warn' if var('temp_warn_unique_orders', false) else 'error' }}"
      meta:
        warn_expires: "2026-06-01"
        ticket: "DATA-1234"
        owner: "data-team@"

При запуске:

dbt test --vars 'temp_warn_unique_orders: true'  # явно временно

Плюс CI gate на warn_expires:

# scripts/check_warn_expirations.py
# Падает если warn_expires в прошлом — заставляет либо fix, либо renew

Без gate severity: warn становится permanent. С gate — заставляет команду либо fix, либо явно renew ticket.

Combining severity with where

- not_null:
    config:
      severity: error
      where: "order_date >= current_date - 30"  # only recent data
      error_if: ">10"

This tests not_null на subset (last 30 days). Если > 10 NULLs в last month — error.

Older NULL не trigger this test (excluded по where). May have separate test для historical data:

- not_null:
    config:
      severity: warn  # historical — only warn
      where: "order_date < current_date - 30"

Two tests with different sensitivity for recent vs historical.

Performance: test subset для CI

- unique:
    config:
      severity: error
      where: "order_date >= current_date - 7"  # only last week — fast PR check
      tags: ['ci_fast']
- unique:
    config:
      severity: error
      tags: ['daily_full']  # all data — slower daily test

PR runs CI fast. Daily comprehensive check separately.

store_failures для debugging

When test fails, failing rows can be saved:

- not_null:
    config:
      severity: error
      store_failures: true

Failed rows stored в audit.dbt_test_failures (or similar schema). Examine after CI:

SELECT * FROM audit.test_results.not_null_customer_email_failures;

Useful для debugging без re-running test. Combined с error_if:

- dbt_expectations.expect_column_values_to_be_between:
    min_value: 0
    max_value: 10000
    config:
      severity: error
      error_if: ">5"
      store_failures: true  # save all failures для investigation

Module 07 has detailed lesson on store_failures.

Production thresholds tuning

How to set thresholds:

Step 1: Run test without threshold (severity warn).

- not_null:
    config:
      severity: warn  # observe

Observe для 2 weeks: 0 failures? 5? 50? 500?

Step 2: Set thresholds based on observation.

If typically 5-15 NULLs (noise):

- not_null:
    config:
      severity: error
      warn_if: ">20"  # above typical noise
      error_if: ">100"  # significant degradation

Step 3: Iterate. Если warns triggering часто -> re-evaluate. Maybe loosen или fix root cause.

Step 4: Tighten over time. As data quality improves, lower thresholds.

# Year 1
error_if: ">100", warn_if: ">20"

# Year 2 (data improved)
error_if: ">50", warn_if: ">10"

# Year 3 (target zero)
error_if: ">0", warn_if: ">0"  # no tolerance

Progressive tightening.

Anti-patterns

1. Severity warn used as ‘skip’

- unique:
    config:
      severity: warn  # don't want to fix this

Warn is для observation / soft monitoring. Не для ‘ignore’. If unique IS critical но not currently working — fix data, не downgrade severity.

2. Thresholds too lax

- not_null:
    config:
      severity: error
      error_if: ">100000"  # 100K NULLs allowed?!

If you tolerate 100K NULLs — what’s the point of test? Either tests is critical -> tight thresholds. Or it’s not -> don’t test.

3. No thresholds в production

- unique:
    config:
      severity: error  # blocks CI on ANY violation

For most tests это correct. But для statistical tests с natural variance — single violation can be acceptable. Tune thresholds.

4. Mixing severity и thresholds illogical

- not_null:
    config:
      severity: warn  # warns by default
      error_if: ">10"  # but errors if > 10?

Confusing. Pick one approach:

Always warn (no error_if).
Severity error with thresholds.

Не warn-base + error_if (conflicting).

DuckDB specifics

Threshold logic works identically.
Performance: thresholds computed via COUNT() after test query — minimal overhead.
Store_failures: DuckDB creates schema dbt_test__audit for failures.

Попробуй сам

В labs:

Add severity warn + threshold к existing test:

- not_null:
    config:
      severity: warn
      warn_if: ">5"

Observe runs: how many failures появляются typically?
Tune thresholds based on observation.
Add tags: ‘critical’ для critical tests, ‘statistical’ для exploratory.
Test selective runs: dbt test --select tag:critical — should run faster чем full suite.

Ключевые выводы

Severity: error (default) blocks CI; warn logs only.
error_if / warn_if — counter-based thresholds для graduated response.
Per-environment severity: Jinja conditionals based on target.name.
Tags + selectors for selective testing (CI fast, daily full).
Combine с where: subset testing с different sensitivity.
store_failures: saves failing rows для debugging.
Tuning workflow: observe -> set baseline -> tighten over time.
Anti-patterns: warn ≠ skip, thresholds too lax, mixed severity logic.

Проверка знанийKnowledge check

Какая разница между severity: warn и severity: error + error_if: '>0'?

ОтветAnswer

Они **функционально схожи** но имеют subtle differences в semantics и behavior.\n\n**severity: warn**:\n\n```yaml\n- not_null:\n config:\n severity: warn\n```\n\nBehavior:\n- ANY failure (1+ rows): test result = WARN.\n- CI passes (warn не block).\n- Logs show warning.\n\n**severity: error + error_if: '>0'**:\n\n```yaml\n- not_null:\n config:\n severity: error\n error_if: \">0\"\n```\n\nBehavior:\n- ANY failure (1+ rows): test result = ERROR.\n- CI fails (error blocks).\n- Logs show error.\n\n**Key difference: error_if blocks CI, warn doesn't**.\n\nNot really equivalent. Different impact на pipeline:\n\n- warn: 'I want to know, but не block deploys'.\n- error: 'I want to block deploys'.\n\n**More relevant comparison**:\n\n**severity: warn + warn_if: '>X'**:\n\n```yaml\n- not_null:\n config:\n severity: warn\n warn_if: \">10\"\n```\n\nBehavior:\n- ≤10 failures: test passes (below threshold).\n- 11+ failures: test result = WARN.\n- CI passes always (severity=warn).\n\nUse case: total acceptable, monitor higher thresholds, не block.\n\n**severity: error + warn_if: '>X' + error_if: '>Y' (where Y > X)**:\n\n```yaml\n- not_null:\n config:\n severity: error\n warn_if: \">10\"\n error_if: \">100\"\n```\n\nBehavior:\n- ≤10 failures: test passes.\n- 11-100 failures: test result = WARN. CI passes.\n- 101+ failures: test result = ERROR. CI fails.\n\nUse case: graduated response. Tolerance в pequeño noise, alert at medium, block on severe.\n\n**Best practice matrix**:\n\n| Scenario | Configuration |\n|---|---|\n| Critical, no tolerance | severity: error (no thresholds) |\n| Critical, small tolerance | severity: error + error_if: '>5' |\n| Monitor only, never block | severity: warn |\n| Monitor + alert significant | severity: warn + warn_if: '>10' |\n| Graduated (small=warn, big=block) | severity: error + warn_if + error_if |\n\n**Real-world example**:\n\nFor critical PK test:\n```yaml\n- unique:\n config:\n severity: error # any duplicate blocks CI\n # no thresholds — zero tolerance\n```\n\nFor statistical test:\n```yaml\n- dbt_expectations.expect_column_mean_to_be_between:\n config:\n severity: error\n warn_if: \">1\" # any violation = warn\n error_if: \">5\" # significant pattern = error\n```\n\nFor business rule с natural exceptions:\n```yaml\n- premium_tier_revenue_threshold:\n config:\n severity: warn # never block — это monitoring\n warn_if: \">10\" # alert if pattern emerges\n```\n\n**Misconception**: 'warn = error with error_if: >0'. Not exactly — different CI impact. warn is observation. error is gating. Choose intentionally.\n\n**Edge case: error_if: '>0' vs no_threshold**:\n\n```yaml\n# Both block CI on any failure\n- not_null # default severity error, no threshold\n\n- not_null:\n config:\n severity: error\n error_if: \">0\"\n```\n\nBehaviorally identical: any failure -> error -> CI fails. error_if: '>0' is redundant (default is essentially this).\n\nUse error_if когда need values > 0 (which means tolerance). For zero tolerance — just use default severity error.

Проверка знанийKnowledge check

Команда хочет одинаковый test на dev и prod, но с разной severity (warn для dev, error для prod). Как реализовать?

ОтветAnswer

Jinja conditional в config based on target.name.\n\n**Approach 1: Inline conditional**:\n\n```yaml\n- dbt_expectations.expect_column_mean_to_be_between:\n min_value: 50\n max_value: 200\n config:\n severity: \"{{ 'warn' if target.name == 'dev' else 'error' }}\"\n```\n\nКомпилит:\n- dev target: severity: warn\n- prod target: severity: error\n\nClean, declarative.\n\n**Approach 2: Multi-condition**:\n\n```yaml\nconfig:\n severity: \"{{ \n 'error' if target.name == 'prod' \n else 'warn' if target.name == 'staging' \n else 'info'\n }}\"\n```\n\nThree-way logic для multiple environments.\n\n**Approach 3: Per-environment thresholds**:\n\n```yaml\nconfig:\n severity: error # constant\n error_if: \"{{ '>0' if target.name == 'prod' else '>10' }}\"\n warn_if: \"{{ '>0' if target.name == 'prod' else '>5' }}\"\n```\n\nSame severity, different thresholds.\n\n**Approach 4: vars-based**:\n\n```yaml\nconfig:\n severity: \"{{ var('test_severity', 'error') }}\"\n```\n\n```bash\n# dev\ndbt test --vars 'test_severity: warn'\n\n# prod\ndbt test # uses default 'error'\n```\n\nFlexible — controlled at run-time.\n\n**Approach 5: profiles vars**:\n\n```yaml\n# profiles.yml\nmyproject:\n outputs:\n dev:\n type: duckdb\n vars:\n test_severity: warn\n prod:\n type: duckdb\n vars:\n test_severity: error\n```\n\n```yaml\n# Test config\nconfig:\n severity: \"{{ var('test_severity') }}\"\n```\n\nSeverity baked в profile. dbt test on dev -> warn. dbt test on prod -> error.\n\n**Approach 6: Tagged tests с different selectors**:\n\n```yaml\n- dbt_expectations.expect_column_mean_to_be_between:\n min_value: 50\n max_value: 200\n config:\n severity: warn\n tags: ['warn_only']\n- dbt_expectations.expect_column_mean_to_be_between:\n min_value: 50\n max_value: 200\n config:\n severity: error\n tags: ['prod_critical']\n```\n\nDuplicate test definitions. Run selective:\n\n```bash\n# dev\ndbt test --select tag:warn_only\n\n# prod\ndbt test --select tag:prod_critical\n```\n\nUgly (duplication), but explicit.\n\n**Recommendation**:\n\nApproach 1 (inline conditional) для most cases:\n- Clean YAML.\n- Documentation: 'severity depends on target — see Jinja'.\n- No vars or selector complexity.\n\n```yaml\nconfig:\n severity: \"{{ 'warn' if target.name in ['dev', 'staging'] else 'error' }}\"\n```\n\n**Documentation**:\n\nAdd comments explaining:\n\n```yaml\nconfig:\n # Severity varies by environment:\n # - dev/staging: warn (observation only, не block CI)\n # - prod: error (block deploys on failure)\n severity: \"{{ 'warn' if target.name in ['dev', 'staging'] else 'error' }}\"\n```\n\nFuture devs понимают rationale.\n\n**Multiple environments cascade**:\n\n```yaml\nconfig:\n severity: \"{{ \n 'error' if target.name == 'prod' else \n 'warn' if target.name == 'staging' else \n 'info' \n }}\"\n error_if: \"{{ \n '>0' if target.name == 'prod' else \n '>10' if target.name == 'staging' else \n '>100' \n }}\"\n warn_if: \"{{ \n '>0' if target.name == 'prod' else \n '>5' if target.name == 'staging' else \n '>50' \n }}\"\n```\n\nGraduated по environment: prod strict, staging moderate, dev loose.\n\n**Anti-pattern: hardcoded environment**:\n\n```yaml\n# BAD\nconfig:\n severity: error # hardcoded\n```\n\nIf you need different behavior на dev — change to warn. But then prod also warn. Conflict.\n\nUse target.name or vars to differentiate. Hardcoded severity locks behavior across environments.\n\nKey: Jinja conditionals в config support production-grade test configurations. Different severities, thresholds, behaviors per environment without code duplication.

Severity и thresholds: error_if, warn_if

Recap semantics в одной таблице

Tag-based selectors: критично для middle

Real use cases

Statistical tests (natural noise)

Business rule violations

Data quality on imperfect sources

Freshness/recency

Threshold operators

Severity per environment

Incident response: severity warn навечно — antipattern

Combining severity with where

Performance: test subset для CI

store_failures для debugging

Production thresholds tuning

Anti-patterns

1. Severity warn used as ‘skip’

2. Thresholds too lax

3. No thresholds в production

4. Mixing severity и thresholds illogical

DuckDB specifics

Попробуй сам

Ключевые выводы

Закончили урок?