Зачем разбираться в ролях
Когда новичок открывает hh.ru или LinkedIn, вакансии с “data” в названии лежат вперемешку: “Data Engineer”, “Data Analyst”, “Data Architect”, “ML Engineer”, “Analytics Engineer”, “Data Platform Engineer”, “BI Developer”. В реальности это разные профессии с разными скиллами, разной зарплатой, разной траекторией роста. Прыгать между ними нельзя без перенастройки навыков.
Эта классификация не universal — в каждой компании названия могут плыть. В стартапе один человек выполняет три роли. В Big Tech одна “Data Engineer” вакансия может быть про Spark/Kafka, в другой компании — про SQL/dbt. Но базовые архетипы есть, и их полезно знать, чтобы целить в нужную роль и не тратить год на переучивание.
Data Engineer (DE)
Главный игрок этого курса. DE строит и поддерживает data pipelines: получает данные из источников, трансформирует, складывает в хранилище, обеспечивает доступность.
Типичные задачи:
- Дизайн и реализация ETL/ELT пайплайнов (Airflow / Dagster / Prefect).
- Интеграция с источниками: API, базы, файлы, потоки (Kafka).
- Управление DWH (Snowflake, BigQuery, Redshift) или Lakehouse (Databricks, Iceberg).
- Performance, costs, SLA.
- Data quality, observability.
Скиллы:
- SQL на advanced-уровне (window functions, CTE, optimization, EXPLAIN).
- Python для скриптов, оркестрации, простых трансформаций (pandas / sqlalchemy / requests).
- Distributed computing: понимание Spark (или альтернатив), партиционирование.
- Orchestration: Airflow / Dagster / Prefect.
- Cloud: один из (AWS / GCP / Azure) на уровне S3 / IAM / DWH services.
- Linux / Docker / Git — на уровне “уверенный пользователь”.
Junior DE в 2026 — это уровень джуниор-бэкенда: уверенный SQL, базовый Python, понимание pipeline-архитектуры, опыт с одним облаком хотя бы pet-проектом.
Analytics Engineer (AE)
AE — это новая роль, выросшая из dbt-стек. Стоит между DE и Data Analyst: пишет SQL-трансформации, моделирует данные для аналитики, владеет уровнем staging->intermediate->marts.
Типичные задачи:
- dbt-модели: staging, dim, fact, mart-таблицы.
- Dimensional modeling (см. курс 07): star schema, slowly changing dimensions.
- Data tests, документация моделей.
- Работа с BI-инструментом (Looker, Tableau, Metabase) над дизайном дашбордов.
Скиллы:
- SQL на advanced — даже глубже, чем DE.
- dbt — must-have.
- Dimensional modeling — Kimball, star schema.
- BI tools — хотя бы один.
- Python — желательно, но не критично.
AE — отличный путь для аналитика, который хочет в инженерию, но не хочет писать pipelines на Spark. Зарплата в 2026 — обычно близкая к DE (могут быть варианты выше из-за domain knowledge).
Analytics Engineering как профессия: что делает AE и как dbt стал основой ролиData Analyst (DA)
DA — это про инсайты. Использует уже подготовленные DE/AE данные, строит дашборды, проводит ad-hoc анализ, отвечает на вопросы бизнеса.
Не путать с DE: DA редко пишет ETL, не управляет DWH-инфрой, не разбирается в Airflow / Spark. Это другой профиль.
Скиллы:
- SQL базовый-средний (JOIN, GROUP BY, аналитические функции).
- Excel / Google Sheets на продвинутом уровне.
- BI tools (Tableau / Power BI / Looker / Metabase).
- Statistics базовая.
- Domain knowledge в индустрии — критично.
DA -> AE -> DE — типичная карьерная траектория для аналитиков в инженерию.
ML Engineer (MLE)
MLE строит ML-инфраструктуру — feature store, model serving, retraining pipelines, monitoring моделей. Не путать с Data Scientist, который тренирует модели и делает research.
Типичные задачи:
- Feature engineering и feature store (Feast, Tecton).
- Model serving (FastAPI / SageMaker / Vertex AI / KServe).
- Training pipelines (Kubeflow, MLflow).
- Monitoring моделей в проде (drift, perf).
- A/B-тесты моделей.
Скиллы:
- Python deep — основной язык.
- ML фреймворки — PyTorch / TensorFlow / scikit-learn.
- Distributed training (Spark MLlib / Ray / Horovod).
- Kubernetes, Docker.
- MLOps — CI/CD для моделей.
MLE требует ML-знаний поверх инженерных. Это путь для тех, кто пришёл из ML/research и хочет в production, либо для DE, кто захотел углубиться в ML.
Data Scientist (DS)
DS — это про research: модели, гипотезы, экспериментирование, статистика. В DE-курсе DS упоминается для контраста.
Типичные задачи:
- EDA (exploratory data analysis).
- Тренировка моделей в Jupyter / Colab.
- A/B-тесты, причинно-следственный анализ.
- Презентация результатов бизнесу.
Скиллы: Python (pandas / numpy / scikit-learn), статистика, machine learning, иногда глубокий ML (deep learning).
DS обычно НЕ пишет production-код — это работа MLE/DE. Граница в индустрии плывёт, в маленьких компаниях DS делает всё.
Data Platform Engineer (DPE)
DPE строит инфраструктуру, на которой работают DE/AE/MLE. Это уже больше DevOps/SRE с уклоном в data.
Типичные задачи:
- Деплой и поддержка Airflow, Spark, Kafka на Kubernetes.
- IAM, security, network для data-сервисов.
- Cost optimization на cloud-уровне.
- Self-service platform: чтобы DE/AE могли сами деплоить пайплайны.
- Monitoring всего стека.
Скиллы:
- Kubernetes deep — must.
- Terraform / IaC — must.
- Cloud deep (AWS/GCP/Azure).
- Networking, security.
- Python для tooling.
DPE — это карьерный путь для DE с интересом к инфре, или для DevOps с интересом к data. Зарплата обычно высокая, дефицит специалистов сильный.
Data Architect (DA / Architect)
Архитектор проектирует data-системы на уровне организации: какой DWH, какая модель данных, как интегрировать сервисы, какой governance.
Типичные задачи:
- Высокоуровневое проектирование data-платформы.
- Выбор технологий (Snowflake vs BigQuery vs Databricks).
- Governance: глоссарий, ownership, политики.
- Roadmap-планирование, ROI расчёты.
Скиллы:
- Все технологии на overview — широта важнее глубины.
- Бизнес-понимание — что компании реально нужно.
- Communication, политика — работа с C-level.
- 10+ лет опыта обычно.
Это senior-роль, путь после 5-7 лет в DE. Не для junior.
BI Developer
BI Developer строит дашборды и отчёты на BI-платформе. Это технически слабее чем AE/DE, но требует деталей BI-tool и понимания бизнеса.
Типичные задачи:
- Tableau / Power BI / Looker dashboards.
- Semantic-layer (LookML, MicroStrategy).
- Trainings / support пользователей.
Скиллы:
- SQL среднего уровня.
- BI tools глубоко.
- Business domain.
BI Developer — соседняя профессия с DA, иногда совмещается. В крупных компаниях с тяжёлой BI-платформой это отдельная роль.
Карта ролей
Вертикаль — близость к инфре vs близость к бизнесу
Инфра, K8s, IaCData Platform Engineer: инфра, Kubernetes, Terraform, deployment, security. Близко к DevOps
Pipelines, DWHData Engineer: ETL/ELT pipelines, оркестрация, DWH/lake, performance, observability
ML pipelinesML Engineer: ML-инфра, feature store, model serving, MLOps
dbt, dim modelingAnalytics Engineer: dbt, dimensional modeling, transformations, на стыке инженерии и аналитики
Research, modelsData Scientist: research, модели, гипотезы, статистика
Insights, BIData Analyst: ad-hoc analysis, insights, отвечает на вопросы бизнеса
DashboardsBI Developer: дашборды, semantic layer, BI-платформа
Где границы плывут
В реальности 2026 года границы между ролями подвижны:
- В стартапах “Data Engineer” обычно делает работу AE + часть DA. Один человек закрывает всё.
- В Big Tech роли узкие: один DE отвечает только за Kafka-streaming, другой только за Iceberg, третий — за Airflow-оркестрацию.
- В средних компаниях DE часто делает работу AE (пишет dbt-модели).
- Analytics Engineer в США — established роль, в РФ ещё растёт, иногда называется “BI Engineer” или “Data Engineer (BI)”.
Названия в вакансиях смотри не по тайтлу, а по описанию. “Data Engineer” с задачами “Tableau дашборды, Excel-выгрузки” — это на самом деле BI/Analyst. “Senior Data Engineer” с задачами “Kafka, Iceberg, Spark Streaming” — это уже опытная инженерная роль.
Junior tip: не зацикливайся на одной роли при поиске. Подавайся на все, где описание похоже на твои навыки. Через 6-12 месяцев работы поймёшь, куда хочется углубляться.
Карьерные траектории
Типичные пути:
- DA -> AE -> DE — самая частая траектория из аналитики в инженерию.
- Backend -> DE — для разработчиков с интересом к данным. Сильный Python/SQL уже есть.
- DE -> DPE — для DE, которые любят инфраструктуру.
- DE -> MLE — для DE с интересом к ML (требует освоить ML-стек).
- DE -> AE -> Manager / Architect — карьера в leadership.
Зарплаты (2026, ориентир)
Это среднее по индустрии, конкретные цифры зависят от страны/компании. Для РФ в Москве/Питере (Junior -> Middle -> Senior, рубли в месяц):
- Data Analyst: 90k -> 180k -> 280k.
- BI Developer: 120k -> 200k -> 300k.
- Analytics Engineer: 150k -> 250k -> 400k.
- Data Engineer: 150k -> 280k -> 450k+.
- ML Engineer: 180k -> 320k -> 500k+.
- Data Platform Engineer: 180k -> 320k -> 500k+.
- Data Architect: senior-only, 500k+.
В международном найме (особенно ремоут) цифры в долларах, разброс x3-5.
Зарплаты — это медиана по рынку. Реальный диапазон шире, и зависит от компании, домена, скиллов. Не воспринимай как гарантию.
Попробуй сам
- Открой 10 вакансий “Data Engineer” в разных компаниях. По описанию (не тайтлу!) расклассифицируй: настоящий DE, AE замаскированный под DE, BI Developer под DE.
- Возьми свой текущий профиль (если работаешь) или ожидаемый (если учишься). К какой роли ты ближе всего? Какие 2-3 скилла нужно добрать, чтобы перейти в DE-junior?
- Найди два open-source DE-проекта на GitHub (например, dbt-labs/dbt-core, apache/airflow). Посмотри на типы задач в issues. Какие из них junior-friendly?