Data Engineering
Пайплайны данных от ingestion до serving: Apache Spark, CDC, Governance, карьерный роадмап.
6 курсов ·
449 уроков ·
~330 часов
0% · 0 из 449 уроков
Apache Spark Deep-Dive
Полный курс по Apache Spark — от внутренней архитектуры и Catalyst до lakehouse-форматов, Structured Streaming и production-операций для data-инженеров
Продвинутый Открыть →
Не начато
Debezium CDC Mastery
Полное руководство по Change Data Capture с Debezium — от основ до production deployment
Средний Открыть →
Не начато
Data Governance
Полный курс по управлению данными — от метаданных и каталогов до приватности, качества и контроля доступа
Средний Открыть →
Не начато
System Design для Data Engineer
Проектирование data-платформ — от pipeline architecture через lakehouse и streaming до production data operations
Продвинутый Открыть →
Не начато
Apache DataFusion
Extensible query engine на базе Apache Arrow: архитектура, SQL и DataFrame API, оптимизация запросов, расширения на Rust и Python
Продвинутый Открыть →
Не начато
Storage Formats Deep-Dive
Форматы хранения данных — от Parquet и ORC через Arrow до Delta Lake и Iceberg. Побайтовый разбор, кодировки, компрессия, schema evolution, table formats.
Продвинутый Открыть →
Не начато