Learning Platform
Каталог / Data Engineering / Apache Spark Internals
Глоссарий Troubleshooting
Курс 29 · Data Engineering

Apache Spark Internals

Глубокое погружение во внутреннее устройство Apache Spark для senior data-инженеров. От RDD и модели выполнения, scheduler internals, shuffle и управления памятью до Catalyst/Tungsten, whole-stage codegen, Adaptive Query Execution и internals Structured Streaming (StateStore, IncrementalExecution, transformWithState). Покрывает сериализацию и UnsafeRow, Apache Arrow и Spark Connect, расширение движка через DataSource V2 и кастомные правила Catalyst, External Shuffle Service, alternative execution engines (Comet, Gluten), профилирование и работу с исходным кодом Spark. Курс для тех, кто уже пишет Spark-пайплайны в проде и хочет понять, как движок устроен изнутри.

Advanced
Уровень
77
Уроков
78
Часов
17
Модулей
Начать курс → К первому уроку
Программа
17 модулей · 77 уроков
00
Введение в курс
6 уроков · 3 ч
6 уроков Открыть →
01
Философия Spark internals
4 урока · 2 ч
4 урока Открыть →
02
RDD и модель выполнения
10 уроков · 5 ч
10 уроков Открыть →
03
Архитектура и scheduler internals
12 уроков · 6 ч
12 уроков Открыть →
04
Shuffle internals
8 уроков · 4 ч
8 уроков Открыть →
05
Память и storage internals
10 уроков · 5 ч
10 уроков Открыть →
06
Catalyst и Tungsten
12 уроков · 6 ч
12 уроков Открыть →
07
Сериализация и row format
8 уроков · 4 ч
8 уроков Открыть →
08
Adaptive Query Execution
10 уроков · 5 ч
10 уроков Открыть →
09
Internals Structured Streaming
12 уроков · 6 ч
12 уроков Открыть →
10
Apache Arrow и Spark Connect
12 уроков · 6 ч
12 уроков Открыть →
11
Расширение Spark
10 уроков · 5 ч
10 уроков Открыть →
12
External Shuffle Service
6 уроков · 3 ч
6 уроков Открыть →
13
Alternative Execution Engines
12 уроков · 6 ч
12 уроков Открыть →
14
Исходники и отладка
8 уроков · 4 ч
8 уроков Открыть →
15
Капстоун: дебаг internals
10 уроков · 5 ч
10 уроков Открыть →
16
Приложение
4 урока · 2 ч
4 урока Открыть →

Ещё в направлении · Data Engineering

Все материалы направления →