Обзор 15 модулей
В этом уроке — карта всего курса. Цель не запомнить, а получить ощущение, что вас ждёт впереди: какие темы пойдут когда, что зависит от чего, и в какой момент урок «настоящего инструмента» станет применим в реальной работе.
Курс структурирован как пирамида. Каждый последующий модуль опирается на предыдущие. Пропускать модули можно — но в большинстве случаев это себе во вред: пропустив модуль про HTTP-методы, вы не поймёте принципы REST; пропустив REST — потеряетесь в OpenAPI; и так далее.
Структура курса в одной диаграмме
15 модулей, разбитые на 4 содержательных блока. Стрелки -- направление обязательной зависимости.
Модули 00-04: Фундамент
Цель блока — за 12-15 часов вы должны полностью понимать, что происходит между клиентом и сервером, когда curl отправляет запрос. Если после этого блока вы ещё не уверены — не идите дальше, перечитайте.
Особое внимание модулю 2 — это самый важный модуль курса. Если вы поймёте, что HTTP — это текстовый stateless протокол поверх TCP, и сможете прочитать raw HTTP-обмен — всё остальное в курсе будет лёгким. Если не поймёте — будете путаться, почему requests.get иногда возвращает не то, что ожидалось.
requests и httpx: введение в HTTP-клиенты Python
Модули 05-08: Ежедневная работа
Здесь начинается «настоящая жизнь» Junior DE. Вы будете писать Python-клиентов, читать OpenAPI-схемы партнёров, разбираться с OAuth2-аутентификацией и обрабатывать пагинацию + rate-limits.
Это самый объёмный блок курса — около 18-20 часов. Здесь начинается реальная разница между Junior, который умеет интегрироваться с любым API, и Junior, который копирует чужие скрипты.
Не пропускайте модуль 9 «Pagination + Resilience». Junior, который не умеет правильно обрабатывать 429 и пагинацию, будет терять данные в первый же день работы. Cursor pagination + exponential backoff — это инструменты, без которых production-pipeline не выживет.
Модули 09-11: Beyond REST
В этом блоке — переход от REST к остальным протоколам, с которыми сталкивается Junior DE на работе. GraphQL для сложных запросов, gRPC для high-performance internal API, real-time через webhooks/SSE/WebSocket, и бинарные форматы Avro/Parquet, которые становятся стандартом для DE-стека.
После этого блока вы будете понимать, когда использовать что: REST для публичного API, GraphQL для гибких запросов с frontend, gRPC для internal микросервисов, webhooks для событий, Avro/Parquet для data lake.
Модули 12-13: Production
Финальный блок. Здесь — практики, без которых код в production падает: тестирование API через mocking и VCR, contract testing через pact (чтобы клиент и сервер не разъезжались), и финальный capstone — реальный multi-source ETL pipeline, который тянет данные из трёх API в Parquet.
Рекомендации по темпу
Курс рассчитан на 50-55 часов чистого времени. Это включает чтение, упражнения и квизы, но не включает реальную работу над собственным проектом.
Лично я рекомендую стандартный темп — модуль за 2 дня, 4-5 недель — с одной оговоркой: после модулей 01, 04, 07 устройте день паузы. Эти модули перегружены концептами, и мозгу нужно время «уложить» новое знание в долгосрочную память. После паузы вы вернётесь и обнаружите, что куски, которые казались мутными, стали очевидными.
Что после курса
Курс «REST API & Data Formats» — самостоятельный продукт, который закрывает интеграции с внешними сервисами. Дальше вам пригодятся:
- Курс «Python (deep)» — concurrency, async, asyncio для параллельных запросов
- Курс «Airflow» — оркестрация ETL-пайплайнов (всё, что вы напишете в этом курсе, оркестрируется в Airflow)
- Курс «Storage Formats» — глубокое погружение в Parquet, Iceberg, Delta Lake
- Курс «System Design для DE» — когда захотите идти на Middle
Все курсы бесплатные, на этой же платформе. Cross-link на них появится в каждом релевантном уроке.
В следующем уроке поговорим, как именно учиться: какие инструменты установить, как организовать sandbox, и почему httpie или curl параллельно с уроком обязательны.