Курс состоит из 19 модулей, сгруппированных в 6 тематических блоков. Примерное время прохождения — 80 часов.
Блок 1: Фундамент (модули 01–01)
Модуль
Тема
Время
01 — Основы форматов хранения
Row vs columnar, кодировки, компрессия, метаданные
~4 ч
Этот блок создаёт концептуальную базу. Всё, что вы изучите дальше, опирается на эти фундаментальные понятия: как данные раскладываются на диске, как кодировки уменьшают объём, как метаданные позволяют пропускать ненужные данные.
Meta’s next-gen формат, F3 (Future-Proof File Format, CMU SIGMOD 2025)
~3 ч
Блок 6: Практика (модули 17–18)
Модуль
Тема
Время
17 — Выбор формата на практике
Decision framework, бенчмарки, миграция
~4 ч
18 — Capstone-проект
Проектирование storage layer для реального use case
~6 ч
Рекомендуемый порядок
Модули 01–10 — строго последовательно. Модули 11–16 (table formats) можно проходить в любом порядке после модуля 10. Модули 17–18 — после всех предыдущих.
TIP
Если вы уже хорошо знакомы с основами (row vs columnar, кодировки), можете начать с модуля 02 (Parquet) — но рекомендуем хотя бы пролистать модуль 01 для выравнивания терминологии.
Закончили урок?
Отметьте его как пройденный, чтобы отслеживать свой прогресс