Learning Platform
Глоссарий Troubleshooting
Урок 20.01 · 18 мин
Начальный
dbt Clouddbt StudioSaaSDeveloper tier

dbt-core, которым ты уже пользовался — это open-source CLI. Бесплатный, MIT-лицензия, локально или в твоём CI. Параллельно dbt Labs продаёт dbt Cloud (теперь часто называемый dbt Studio) — облачную платформу, которая берёт dbt-core и добавляет вокруг него UI, оркестрацию, lineage-исследователь и интеграции.

В 2025 году dbt Labs ребрендировал dbt Cloud в dbt Studio, чтобы подчеркнуть, что это IDE-первая платформа, не просто scheduler. К моменту 2026 в обиходе оба названия — Cloud и Studio — используются как синонимы.

Что даёт Cloud сверху над dbt-core

dbt-core — это инструмент компилятора и runner’а. Cloud — это всё остальное, что нужно команде аналитики, чтобы dbt-core стал production-friendly:

dbt-core vs dbt Cloud / Studio

Cloud не заменяет dbt-core — он строится поверх него. Тот же compile, run, test. Сверху — IDE, scheduler, lineage UI, alerting.

dbt-core (open-source)CLI, compile, run, test, build, parser
dbt Cloud / Studio (SaaS)IDE, Jobs scheduler, Explorer (lineage UI), Notifications, SSO, RBAC

Конкретные функции Cloud, которых нет в core:

  1. Cloud IDE — браузерный редактор моделей с подсветкой Jinja, автокомплитом ref/source, превью SQL без dbt compile, git-интеграцией без локальной установки.

  2. Jobs — крон-планировщик в UI. Можно настроить «каждую ночь в 2:00 запускать dbt build --select tag:nightly на target=prod». Без отдельного Airflow.

  3. Explorer — интерактивный lineage-граф всего проекта. Похож на dbt docs serve, но красивее, с метриками строк и таймингов из последних запусков.

  4. Notifications — Slack/Email/Teams алерты при провалах.

  5. SSO / SAML / RBAC — для enterprise: единый вход, права по группам.

  6. Audit log — кто что когда запускал, для compliance.

  7. CI checks — встроенный GitHub/GitLab/Bitbucket-интеграция: PR-чек на компиляцию и быстрый test.

  8. Semantic Layer (платная фича) — MetricFlow-сервер для запросов из BI с governance.

Из этих компонентов критичные для команды — Jobs (если нет Airflow), Explorer (когда проект > 50 моделей) и Notifications. Остальное нужно по обстоятельствам.


Free Developer tier

dbt Labs позволяет одному разработчику пользоваться Cloud бесплатно:

  • 1 проект
  • 1 разработчик
  • 3000 моделей buildов в месяц
  • Cloud IDE
  • Jobs scheduler
  • Explorer

Этого достаточно для личного проекта или домашнего обучения. Для команды 2+ человек требуется платный план (Team или Enterprise), цены договорные, начинаются с ~100$/seat/month.

Сравнение с dbt-core CLI:

Чтоdbt-coredbt Cloud (Developer free)dbt Cloud Team
Стоимость$0$0от ~100$/seat/mo
АдаптерывсеSnowflake, BigQuery, Databricks, Redshift, Postgres+ Fabric, Trino
IDEтвой IDECloud IDECloud IDE
SchedulerAirflow/Dagster/cronJobsJobs
Lineage UIdbt docs serveExplorerExplorer + версионирование
Алертысвои hooksSlack/Email+ Teams, PagerDuty
SSOнетGoogle OAuth+ SAML, SCIM
Auditнетбазовыйрасширенный
DuckDBданетнет

Критичная нота: dbt Cloud не поддерживает DuckDB. Это значит, материал нашего курса (Jaffle Shop на DuckDB) Cloud-IDE открыть не сможет. Cloud рассчитан на облачные warehouses — Snowflake, BigQuery, Databricks, Redshift, Postgres. Для junior это значит: учиться на DuckDB локально, проекты на Cloud делать на Snowflake/BigQuery.


Когда стоит идти в Cloud, когда не стоит

Идти в Cloud стоит, если:

  • Команда 5+ человек и нет инфраструктурного инженера, который поднимет Airflow.
  • Аналитики хотят пользоваться только браузером, без локальной установки.
  • Нужны Slack/Teams алерты «без своего кода» — Cloud делает из коробки.
  • Compliance требует audit log и SSO.
  • Проект на Snowflake/BigQuery — для них Cloud работает «из коробки».

Не идти в Cloud стоит, если:

  • Уже есть Airflow / Dagster / Prefect — Jobs scheduler становится дубликатом.
  • Warehouse — DuckDB / SQLite / MotherDuck — Cloud не поддерживает.
  • Команда умеет в инфру и хочет полный контроль (Kubernetes job runner, custom alerts).
  • Бюджет ограничен, есть DevOps-ресурс — самохост дешевле в долгую.
  • Регуляторика требует on-prem (хотя Cloud имеет single-tenant deployment, но дороже).

Архитектура Cloud (быстро)

[Cloud IDE / Studio UI / API]
         |
[dbt Cloud orchestrator]
   - hosts your project repo
   - runs dbt-core in containers
   - schedules jobs
         |
[Your warehouse: Snowflake / BigQuery / ...]

То есть Cloud — это managed dbt-core. Они хранят твой git-репозиторий (или указывают на твой GitHub/GitLab), запускают dbt build в контейнере, шлют результаты в твой warehouse, и показывают тебе UI поверх артефактов.

С точки зрения warehouse, ничего не меняется — те же таблицы создаются по тем же кредам.


Cloud IDE на скриншоте (mental model)

┌─────────────────────────────────────────────────────────┐
│ jaffle_shop                            target: dev      │
├─────────────────────────────────────────────────────────┤
│ Files                  Editor                           │
│ ├─ models/             ┌─────────────────────────────┐  │
│ │  ├─ staging/         │ -- models/marts/customers.sql│ │
│ │  │  ├─ stg_orders    │                              │ │
│ │  │  └─ stg_customers │ {{ config(materialized=    │  │
│ │  ├─ intermediate/    │   'table') }}              │  │
│ │  └─ marts/           │                            │  │
│ │     └─ customers ←   │ select c.customer_id, ...  │  │
│ ├─ tests/              │ from {{ ref(              │  │
│ ├─ macros/             │   'stg_customers') }} c    │  │
│ └─ dbt_project.yml     │                            │  │
│                        └─────────────────────────────┘  │
│ Branch: feature/add-customers                           │
│ [ Compile ] [ Run ] [ Test ] [ Preview ]                │
└─────────────────────────────────────────────────────────┘

Это полноценная IDE: дерево файлов слева, редактор справа, preview результатов внизу. Запускать dbt run --select customers можно прямо отсюда — кнопкой Run. Git-операции (commit, push, branch) — встроенные.

Для junior, который только освоил dbt-core локально, переход в Cloud IDE — это 5 минут: всё то же самое, только в браузере.


Поверх Cloud работает Explorer

Explorer — это «lineage-карта проекта на стероидах»:

  • Графический DAG всех моделей и sources
  • Поиск по имени модели, по тегу, по domain
  • Клик на модель -> метрики: размер таблицы, время последней пересборки, провалы тестов за неделю
  • Кликабельные связи между моделями
  • Сравнение версий (что изменилось в моделе между двумя commit’ами)

Это особенно ценно для команд 10+ моделей. Без Explorer (или dbt docs serve) lineage в большом проекте теряется в текстовых файлах.

В платном Cloud Explorer показывает production-актуальное состояние: какая модель когда последний раз обновлялась, сколько строк, какие тесты прошли.


Notifications

Простой сценарий: ночной dbt build упал, нужно дать знать команде. В Cloud это конфигурируется в UI:

  1. Заходишь в Job -> Notifications
  2. Выбираешь Slack channel или email
  3. Триггеры: «on success», «on failure», «on cancel»
  4. Готово — Cloud сам шлёт сообщения

В dbt-core без Cloud это придётся писать вручную через Airflow operator или GitHub Actions step с curl https://hooks.slack.com/....


CI Checks

При интеграции Cloud с GitHub: на каждый PR Cloud запускает slim CI:

  1. Скачивает manifest.json от прошлого зелёного main-билда
  2. Сравнивает с PR-кодом через state:modified+
  3. Запускает dbt build --select state:modified+ только на изменённое
  4. Отчитывается в PR check’е

Без Cloud это надо настраивать руками в GitHub Actions / GitLab CI / CircleCI. С Cloud — checkbox в UI.


Studio как новое имя

dbt Labs в 2025 году ребрендировал Cloud в Studio. Причины маркетинговые:

  • «Cloud» звучит generic, как любой SaaS
  • «Studio» подчёркивает IDE-first позиционирование
  • Конкурирует с Hex Studio, DataGrip, MotherDuck Studio как «среда работы аналитика»

Функционал не изменился. URL по-прежнему cloud.getdbt.com, документация местами обновлена на Studio, местами — на Cloud. В 2026 году оба термина в обращении.


Junior pragma

Что выучить про Cloud junior:

  • Знай, что Cloud существует, и команды на его выборе/отказе.
  • Free Developer tier полезен для портфолио (linkedin, github resume) — задеплой простой проект на Snowflake trial + Cloud free.
  • На реальной работе скорее всего придётся работать с Cloud, потому что многие компании на нём — выучи UI в первую неделю.

Что НЕ учить:

  • Детальные конфиги Jobs scheduler — это конкретика твоей компании.
  • Платные фичи (Semantic Layer, Mesh, etc.) — это middle/senior уровень.

Попробуй сам

  1. Зарегистрируйся на cloud.getdbt.com на free Developer tier.
  2. Подключи GitHub-репозиторий с любым dbt-проектом (или fork jaffle_shop).
  3. Подключи warehouse — для теста удобно использовать Snowflake trial (30 дней бесплатно, $400 кредитов).
  4. Открой Cloud IDE — запусти dbt build через UI. Сравни ощущение с локальной CLI.
  5. Создай простой Job: «раз в день build всего проекта». Получи Slack-нотификацию.

Чек-лист

  • dbt Cloud (Studio) — managed SaaS поверх open-source dbt-core.
  • Дополнительно даёт: Cloud IDE, Jobs scheduler, Explorer (lineage UI), Notifications, SSO, RBAC, CI integration.
  • Free Developer tier: 1 проект, 1 разработчик, 3000 model builds/month. Для портфолио и обучения.
  • НЕ поддерживает DuckDB. Только Snowflake / BigQuery / Databricks / Redshift / Postgres / Fabric / Trino.
  • Идти в Cloud стоит: команда 5+, нет Airflow, нужны алерты из коробки, compliance.
  • НЕ идти: уже есть Airflow/Dagster, warehouse не поддерживается, бюджет.
  • 2025: Cloud переименован в Studio (маркетинговый ребрендинг, функционал тот же).
dbt Cloud vs Core: углублённое сравнение
Проверка знанийKnowledge check
У тебя junior-проект на DuckDB локально, и ты хочешь добавить в портфолио опыт работы с dbt Cloud. Какие шаги, и почему DuckDB остаётся локально?
ОтветAnswer
Шаги: 1) Зарегистрируйся на cloud.getdbt.com на free Developer tier. 2) Создай Snowflake trial аккаунт (бесплатно 30 дней + 400$ кредитов на старте) или BigQuery (имеет щедрый free tier на 1 ТБ запросов в месяц). 3) В отдельном репозитории (можно fork jaffle_shop) перепиши profiles.yml на Snowflake/BigQuery. 4) Подключи репозиторий к dbt Cloud, настрой target=dev на trial-warehouse. 5) Запусти dbt build из Cloud IDE, создай Job 'daily build at 02:00', настрой Slack notification. DuckDB остаётся локально, потому что dbt Cloud его не поддерживает официально — Cloud рассчитан на облачные warehouses с web-доступом. DuckDB по дизайну local-first (embedded процесс в локальном файле), а Cloud-runner-ы запускаются в контейнерах AWS без доступа к твоему файлу. Это нормально: локально учишься на DuckDB (быстро, без оплаты), для Cloud-демонстрации в портфолио — облачный warehouse trial.

Проверьте понимание

Результат: 0 из 0
Концептуальный
Вопрос 1 из 6. В чём принципиальная разница между dbt-core и dbt Cloud (Studio)?

Закончили урок?

Отметьте его как пройденный, чтобы отслеживать свой прогресс

Войдите чтобы оценить урок

Прогресс модуля
0 из 4