Learning Platform
Глоссарий Troubleshooting
Урок 19.01 · 22 мин
Начальный
rolesdata-engineeranalytics-engineerml-engineercareer

Зачем разбираться в ролях

Когда новичок открывает hh.ru или LinkedIn, вакансии с “data” в названии лежат вперемешку: “Data Engineer”, “Data Analyst”, “Data Architect”, “ML Engineer”, “Analytics Engineer”, “Data Platform Engineer”, “BI Developer”. В реальности это разные профессии с разными скиллами, разной зарплатой, разной траекторией роста. Прыгать между ними нельзя без перенастройки навыков.

Эта классификация не universal — в каждой компании названия могут плыть. В стартапе один человек выполняет три роли. В Big Tech одна “Data Engineer” вакансия может быть про Spark/Kafka, в другой компании — про SQL/dbt. Но базовые архетипы есть, и их полезно знать, чтобы целить в нужную роль и не тратить год на переучивание.

Data Engineer (DE)

Главный игрок этого курса. DE строит и поддерживает data pipelines: получает данные из источников, трансформирует, складывает в хранилище, обеспечивает доступность.

Типичные задачи:

  • Дизайн и реализация ETL/ELT пайплайнов (Airflow / Dagster / Prefect).
  • Интеграция с источниками: API, базы, файлы, потоки (Kafka).
  • Управление DWH (Snowflake, BigQuery, Redshift) или Lakehouse (Databricks, Iceberg).
  • Performance, costs, SLA.
  • Data quality, observability.

Скиллы:

  • SQL на advanced-уровне (window functions, CTE, optimization, EXPLAIN).
  • Python для скриптов, оркестрации, простых трансформаций (pandas / sqlalchemy / requests).
  • Distributed computing: понимание Spark (или альтернатив), партиционирование.
  • Orchestration: Airflow / Dagster / Prefect.
  • Cloud: один из (AWS / GCP / Azure) на уровне S3 / IAM / DWH services.
  • Linux / Docker / Git — на уровне “уверенный пользователь”.

Junior DE в 2026 — это уровень джуниор-бэкенда: уверенный SQL, базовый Python, понимание pipeline-архитектуры, опыт с одним облаком хотя бы pet-проектом.

Analytics Engineer (AE)

AE — это новая роль, выросшая из dbt-стек. Стоит между DE и Data Analyst: пишет SQL-трансформации, моделирует данные для аналитики, владеет уровнем staging->intermediate->marts.

Типичные задачи:

  • dbt-модели: staging, dim, fact, mart-таблицы.
  • Dimensional modeling (см. курс 07): star schema, slowly changing dimensions.
  • Data tests, документация моделей.
  • Работа с BI-инструментом (Looker, Tableau, Metabase) над дизайном дашбордов.

Скиллы:

  • SQL на advanced — даже глубже, чем DE.
  • dbt — must-have.
  • Dimensional modeling — Kimball, star schema.
  • BI tools — хотя бы один.
  • Python — желательно, но не критично.

AE — отличный путь для аналитика, который хочет в инженерию, но не хочет писать pipelines на Spark. Зарплата в 2026 — обычно близкая к DE (могут быть варианты выше из-за domain knowledge).

Analytics Engineering как профессия: что делает AE и как dbt стал основой роли

Data Analyst (DA)

DA — это про инсайты. Использует уже подготовленные DE/AE данные, строит дашборды, проводит ad-hoc анализ, отвечает на вопросы бизнеса.

Не путать с DE: DA редко пишет ETL, не управляет DWH-инфрой, не разбирается в Airflow / Spark. Это другой профиль.

Скиллы:

  • SQL базовый-средний (JOIN, GROUP BY, аналитические функции).
  • Excel / Google Sheets на продвинутом уровне.
  • BI tools (Tableau / Power BI / Looker / Metabase).
  • Statistics базовая.
  • Domain knowledge в индустрии — критично.

DA -> AE -> DE — типичная карьерная траектория для аналитиков в инженерию.

ML Engineer (MLE)

MLE строит ML-инфраструктуру — feature store, model serving, retraining pipelines, monitoring моделей. Не путать с Data Scientist, который тренирует модели и делает research.

Типичные задачи:

  • Feature engineering и feature store (Feast, Tecton).
  • Model serving (FastAPI / SageMaker / Vertex AI / KServe).
  • Training pipelines (Kubeflow, MLflow).
  • Monitoring моделей в проде (drift, perf).
  • A/B-тесты моделей.

Скиллы:

  • Python deep — основной язык.
  • ML фреймворки — PyTorch / TensorFlow / scikit-learn.
  • Distributed training (Spark MLlib / Ray / Horovod).
  • Kubernetes, Docker.
  • MLOps — CI/CD для моделей.

MLE требует ML-знаний поверх инженерных. Это путь для тех, кто пришёл из ML/research и хочет в production, либо для DE, кто захотел углубиться в ML.

Data Scientist (DS)

DS — это про research: модели, гипотезы, экспериментирование, статистика. В DE-курсе DS упоминается для контраста.

Типичные задачи:

  • EDA (exploratory data analysis).
  • Тренировка моделей в Jupyter / Colab.
  • A/B-тесты, причинно-следственный анализ.
  • Презентация результатов бизнесу.

Скиллы: Python (pandas / numpy / scikit-learn), статистика, machine learning, иногда глубокий ML (deep learning).

DS обычно НЕ пишет production-код — это работа MLE/DE. Граница в индустрии плывёт, в маленьких компаниях DS делает всё.

Data Platform Engineer (DPE)

DPE строит инфраструктуру, на которой работают DE/AE/MLE. Это уже больше DevOps/SRE с уклоном в data.

Типичные задачи:

  • Деплой и поддержка Airflow, Spark, Kafka на Kubernetes.
  • IAM, security, network для data-сервисов.
  • Cost optimization на cloud-уровне.
  • Self-service platform: чтобы DE/AE могли сами деплоить пайплайны.
  • Monitoring всего стека.

Скиллы:

  • Kubernetes deep — must.
  • Terraform / IaC — must.
  • Cloud deep (AWS/GCP/Azure).
  • Networking, security.
  • Python для tooling.

DPE — это карьерный путь для DE с интересом к инфре, или для DevOps с интересом к data. Зарплата обычно высокая, дефицит специалистов сильный.

Data Architect (DA / Architect)

Архитектор проектирует data-системы на уровне организации: какой DWH, какая модель данных, как интегрировать сервисы, какой governance.

Типичные задачи:

  • Высокоуровневое проектирование data-платформы.
  • Выбор технологий (Snowflake vs BigQuery vs Databricks).
  • Governance: глоссарий, ownership, политики.
  • Roadmap-планирование, ROI расчёты.

Скиллы:

  • Все технологии на overview — широта важнее глубины.
  • Бизнес-понимание — что компании реально нужно.
  • Communication, политика — работа с C-level.
  • 10+ лет опыта обычно.

Это senior-роль, путь после 5-7 лет в DE. Не для junior.

BI Developer

BI Developer строит дашборды и отчёты на BI-платформе. Это технически слабее чем AE/DE, но требует деталей BI-tool и понимания бизнеса.

Типичные задачи:

  • Tableau / Power BI / Looker dashboards.
  • Semantic-layer (LookML, MicroStrategy).
  • Trainings / support пользователей.

Скиллы:

  • SQL среднего уровня.
  • BI tools глубоко.
  • Business domain.

BI Developer — соседняя профессия с DA, иногда совмещается. В крупных компаниях с тяжёлой BI-платформой это отдельная роль.

Карта ролей

Карта ролей в data space

Вертикаль — близость к инфре vs близость к бизнесу

Data Platform Engineer
Инфра, K8s, IaCData Platform Engineer: инфра, Kubernetes, Terraform, deployment, security. Близко к DevOps
Data Engineer
Pipelines, DWHData Engineer: ETL/ELT pipelines, оркестрация, DWH/lake, performance, observability
ML Engineer
ML pipelinesML Engineer: ML-инфра, feature store, model serving, MLOps
Analytics Engineer
dbt, dim modelingAnalytics Engineer: dbt, dimensional modeling, transformations, на стыке инженерии и аналитики
Data Scientist
Research, modelsData Scientist: research, модели, гипотезы, статистика
Data Analyst
Insights, BIData Analyst: ad-hoc analysis, insights, отвечает на вопросы бизнеса
BI Developer
DashboardsBI Developer: дашборды, semantic layer, BI-платформа

Где границы плывут

В реальности 2026 года границы между ролями подвижны:

  • В стартапах “Data Engineer” обычно делает работу AE + часть DA. Один человек закрывает всё.
  • В Big Tech роли узкие: один DE отвечает только за Kafka-streaming, другой только за Iceberg, третий — за Airflow-оркестрацию.
  • В средних компаниях DE часто делает работу AE (пишет dbt-модели).
  • Analytics Engineer в США — established роль, в РФ ещё растёт, иногда называется “BI Engineer” или “Data Engineer (BI)”.

Названия в вакансиях смотри не по тайтлу, а по описанию. “Data Engineer” с задачами “Tableau дашборды, Excel-выгрузки” — это на самом деле BI/Analyst. “Senior Data Engineer” с задачами “Kafka, Iceberg, Spark Streaming” — это уже опытная инженерная роль.

TIP

Junior tip: не зацикливайся на одной роли при поиске. Подавайся на все, где описание похоже на твои навыки. Через 6-12 месяцев работы поймёшь, куда хочется углубляться.

Карьерные траектории

Типичные пути:

  • DA -> AE -> DE — самая частая траектория из аналитики в инженерию.
  • Backend -> DE — для разработчиков с интересом к данным. Сильный Python/SQL уже есть.
  • DE -> DPE — для DE, которые любят инфраструктуру.
  • DE -> MLE — для DE с интересом к ML (требует освоить ML-стек).
  • DE -> AE -> Manager / Architect — карьера в leadership.

Зарплаты (2026, ориентир)

Это среднее по индустрии, конкретные цифры зависят от страны/компании. Для РФ в Москве/Питере (Junior -> Middle -> Senior, рубли в месяц):

  • Data Analyst: 90k -> 180k -> 280k.
  • BI Developer: 120k -> 200k -> 300k.
  • Analytics Engineer: 150k -> 250k -> 400k.
  • Data Engineer: 150k -> 280k -> 450k+.
  • ML Engineer: 180k -> 320k -> 500k+.
  • Data Platform Engineer: 180k -> 320k -> 500k+.
  • Data Architect: senior-only, 500k+.

В международном найме (особенно ремоут) цифры в долларах, разброс x3-5.

NOTE

Зарплаты — это медиана по рынку. Реальный диапазон шире, и зависит от компании, домена, скиллов. Не воспринимай как гарантию.

Попробуй сам

  1. Открой 10 вакансий “Data Engineer” в разных компаниях. По описанию (не тайтлу!) расклассифицируй: настоящий DE, AE замаскированный под DE, BI Developer под DE.
  2. Возьми свой текущий профиль (если работаешь) или ожидаемый (если учишься). К какой роли ты ближе всего? Какие 2-3 скилла нужно добрать, чтобы перейти в DE-junior?
  3. Найди два open-source DE-проекта на GitHub (например, dbt-labs/dbt-core, apache/airflow). Посмотри на типы задач в issues. Какие из них junior-friendly?
Проверка знанийKnowledge check
Ты бэкенд-разработчик, 2 года опыта на Python + PostgreSQL. Хочешь в DE. На какие три роли подавайся в первую очередь и почему?
ОтветAnswer
Три роли: 1) Junior Data Engineer — твой Python/SQL уже сильный, не хватает оркестрации (Airflow) и DWH-знаний; pet-проект с Airflow закрывает. 2) Analytics Engineer — твой SQL подходит, освоить dbt за неделю, dimensional modeling за месяц; меньше инфры, больше моделирования. 3) Data Platform Engineer (если есть опыт с Docker/K8s) — твой backend-опыт ценен, нужно добавить cloud-data services (S3, EMR) и сборку Airflow на K8s. НЕ стоит подаваться сразу на DS/MLE — там нужны ML-знания, которых нет. ML Engineer — путь после года в DE с параллельным изучением ML.

Проверьте понимание

Результат: 0 из 0
Концептуальный
Вопрос 1 из 5. В чём ключевое отличие Analytics Engineer от Data Engineer?

Закончили урок?

Отметьте его как пройденный, чтобы отслеживать свой прогресс

Войдите чтобы оценить урок

Прогресс модуля
0 из 5