Data Engineering

Пайплайны данных от ingestion до serving: Apache Spark, CDC, Governance, карьерный роадмап.

6 курсов · 449 уроков · ~330 часов
0% · 0 из 449 уроков
Apache Spark Deep-Dive
Полный курс по Apache Spark — от внутренней архитектуры и Catalyst до lakehouse-форматов, Structured Streaming и production-операций для data-инженеров
106 уроков ~80 часов 19 модулей
sparkpysparkdata-engineeringlakehousedelta-lake
Продвинутый
Не начато
Открыть →
Debezium CDC Mastery
Полное руководство по Change Data Capture с Debezium — от основ до production deployment
74 уроков ~25 часов 9 модулей
debeziumcdckafkapostgresqlmysql
Средний
Не начато
Открыть →
Data Governance
Полный курс по управлению данными — от метаданных и каталогов до приватности, качества и контроля доступа
66 уроков ~35 часов 11 модулей
data-governancedata-qualityprivacycompliancemetadata
Средний
Не начато
Открыть →
System Design для Data Engineer
Проектирование data-платформ — от pipeline architecture через lakehouse и streaming до production data operations
24 уроков ~70 часов 16 модулей
data-engineeringsystem-designpipelinelakehousestreaming
Продвинутый
Не начато
Открыть →
Apache DataFusion
Extensible query engine на базе Apache Arrow: архитектура, SQL и DataFrame API, оптимизация запросов, расширения на Rust и Python
72 уроков ~40 часов 14 модулей
datafusionapache-arrowquery-enginerustanalytics
Продвинутый
Не начато
Открыть →
Storage Formats Deep-Dive
Форматы хранения данных — от Parquet и ORC через Arrow до Delta Lake и Iceberg. Побайтовый разбор, кодировки, компрессия, schema evolution, table formats.
107 уроков ~80 часов 19 модулей
parquetorcavroarrowdelta-lake
Продвинутый
Не начато
Открыть →