Глубокое погружение во внутреннее устройство Apache Spark для senior data-инженеров. От RDD и модели выполнения, scheduler internals, shuffle и управления памятью до Catalyst/Tungsten, whole-stage codegen, Adaptive Query Execution и internals Structured Streaming (StateStore, IncrementalExecution, transformWithState). Покрывает сериализацию и UnsafeRow, Apache Arrow и Spark Connect, расширение движка через DataSource V2 и кастомные правила Catalyst, External Shuffle Service, alternative execution engines (Comet, Gluten), профилирование и работу с исходным кодом Spark. Курс для тех, кто уже пишет Spark-пайплайны в проде и хочет понять, как движок устроен изнутри.