Learning Platform
Каталог / Data Engineering / Modern storage formats
Глоссарий Troubleshooting
Курс 32 · Data Engineering

Modern storage formats

Форматы хранения данных — от Parquet и ORC через Arrow до Delta Lake и Iceberg. Побайтовый разбор, кодировки, компрессия, schema evolution, table formats.

Advanced
Уровень
107
Уроков
80
Часов
19
Модулей
Начать курс → К первому уроку
Программа
19 модулей · 107 уроков
00
Введение в курс
6 уроков · 3 ч
6 уроков Открыть →
01
Основы форматов хранения
10 уроков · 5 ч
10 уроков Открыть →
02
Apache Parquet Deep-Dive
14 уроков · 7 ч
14 уроков Открыть →
03
Apache ORC Deep-Dive
14 уроков · 7 ч
14 уроков Открыть →
04
Apache Avro Deep-Dive
12 уроков · 6 ч
12 уроков Открыть →
05
Protobuf, Thrift, MessagePack
10 уроков · 5 ч
10 уроков Открыть →
06
CSV, JSON, XML
10 уроков · 5 ч
10 уроков Открыть →
07
Apache Arrow Deep-Dive
14 уроков · 7 ч
14 уроков Открыть →
08
Кодировки данных
12 уроков · 6 ч
12 уроков Открыть →
09
Компрессия и новые подходы
14 уроков · 7 ч
14 уроков Открыть →
10
Schema Evolution и Registry
12 уроков · 6 ч
12 уроков Открыть →
11
Delta Lake Deep-Dive
12 уроков · 6 ч
12 уроков Открыть →
12
Apache Iceberg Deep-Dive
12 уроков · 6 ч
12 уроков Открыть →
13
Apache Hudi Deep-Dive
12 уроков · 6 ч
12 уроков Открыть →
14
Apache Paimon Deep-Dive
12 уроков · 6 ч
12 уроков Открыть →
15
Lance и Vortex
10 уроков · 5 ч
10 уроков Открыть →
16
Nimble и F3
10 уроков · 5 ч
10 уроков Открыть →
17
Выбор формата на практике
10 уроков · 5 ч
10 уроков Открыть →
18
Capstone-проект
8 уроков · 4 ч
8 уроков Открыть →

Ещё в направлении · Data Engineering

Все материалы направления →