Learning Platform
Каталог / Data Engineering / Apache Spark
Глоссарий Troubleshooting
Курс 28 · Data Engineering

Apache Spark

Практический курс по Apache Spark для data-инженеров — DataFrames и Spark SQL, оптимизация производительности, Structured Streaming, lakehouse-форматы (Delta, Iceberg, Hudi) и production-операции. От основ работы с движком до развёртывания пайплайнов в проде.

Intermediate
Уровень
77
Уроков
55
Часов
14
Модулей
Начать курс → К первому уроку
Программа
14 модулей · 77 уроков
00
Введение в курс
6 уроков · 3 ч
6 уроков Открыть →
01
Основы Spark
6 уроков · 3 ч
6 уроков Открыть →
02
DataFrames и Spark SQL
16 уроков · 8 ч
16 уроков Открыть →
03
Оптимизация производительности
12 уроков · 6 ч
12 уроков Открыть →
04
UDF и производительность
10 уроков · 5 ч
10 уроков Открыть →
05
Оптимизация хранения
10 уроков · 5 ч
10 уроков Открыть →
06
Мониторинг и наблюдаемость
10 уроков · 5 ч
10 уроков Открыть →
07
Structured Streaming
16 уроков · 8 ч
16 уроков Открыть →
08
Lakehouse-форматы
16 уроков · 8 ч
16 уроков Открыть →
09
Production-операции
16 уроков · 8 ч
16 уроков Открыть →
10
Тестирование и качество данных
16 уроков · 8 ч
16 уроков Открыть →
11
Экосистема Spark: MLlib и GraphX
6 уроков · 3 ч
6 уроков Открыть →
12
Capstone-проект
10 уроков · 5 ч
10 уроков Открыть →
13
Приложение
4 урока · 2 ч
4 урока Открыть →

Ещё в направлении · Data Engineering

Все материалы направления →