Решение проблем — Python для Data Engineer

Q: ImportError: cannot import name 'X' (most likely due to a circular import)

Модули A и B импортируют друг друга на top-level. Когда A импортирует B, B пытается импортировать A — но A ещё не закончил инициализацию (его module dict частично пуст). Python видит `partially initialized module` и кидает ImportError. Архитектурный smell — обычно нарушение Single Responsibility или забытое выделение общего слоя. Переместите проблемный import внутрь функции/метода (lazy import) — модуль импортируется при первом вызове, когда оба готовы Используйте `if TYPE_CHECKING:` блок (PEP 484) для type-only импортов — не выполняется в runtime Выделите общий код в третий модуль C, который импортируют и A и B — устранит cycle архитектурно Применяйте dependency injection: вместо импорта класса передавайте его как параметр Проверьте граф зависимостей: `pydeps src/ --max-bacon 2 --pylib-all` визуализирует cycles в проекте

Q: RecursionError: maximum recursion depth exceeded

Python имеет жёсткий лимит глубины стека вызовов (`sys.getrecursionlimit()` — обычно 1000). Лимит защищает от stack overflow процесса. Python (CPython) НЕ оптимизирует tail calls, поэтому глубокая рекурсия не превращается в цикл автоматически. При обходе deep tree / linked list / parsing рекурсия достигает лимита. Перепишите алгоритм итеративно: используйте explicit stack/queue (`collections.deque`) вместо вызова себя Увеличьте лимит осторожно: `sys.setrecursionlimit(10000)` — но риск real stack overflow процесса (segfault) Запустите в потоке с увеличенным stack size: `threading.Thread(target=fn).start()` после `threading.stack_size(64*1024*1024)` Используйте генераторы вместо рекурсии для lazy iteration: `yield from` делегирует без углубления стека Для динамики используйте memoization (`@functools.lru_cache`) — уменьшает число рекурсивных вызовов экспоненциально

Q: MemoryError (or unbounded memory growth)

Утечка памяти — объекты не освобождаются GC из-за reference cycle или удерживания в long-lived collection (cache, list, dict). Также частая причина: чтение большого файла целиком (`f.read()`) вместо потокового; использование list comprehension там, где нужен generator. Reference cycle с `__del__` методом блокирует cyclic GC до Python 3.4. Профилируйте: `python -m tracemalloc script.py` или `pip install memory-profiler && mprof run script.py` Замените list comprehension на generator: `(x*2 for x in data)` вместо `[x*2 for x in data]` для streaming Читайте файлы потоково: `for line in open(path): ...` не загружает весь файл в RAM Очищайте long-lived caches явно: `cache.clear()` или используйте `weakref.WeakValueDictionary` Запустите cyclic GC принудительно: `import gc; gc.collect()` — освобождает reference cycles

Question 1

IndentationError: unexpected indent

Accepted Answer

Python 3 запрещает смешивать tab и space внутри одного блока (PEP 8 + tokenizer error TabError). При copy-paste из веб-страниц часто заносится non-breaking space (U+00A0) вместо ASCII space (0x20), либо локальные настройки editor'а отличаются от tabstop проекта. Включите визуализацию whitespace в editor: VS Code `"editor.renderWhitespace": "all"`, PyCharm — `View → Active Editor → Show Whitespaces` Запустите `python -X dev script.py` — расширенные диагностики покажут точный токен и позицию Перенаберите проблемный блок вручную, без copy-paste Создайте `.editorconfig` в корне проекта: `indent_style = space` + `indent_size = 4` (PEP 8 standard) Запустите linter: `ruff check --select E1,E2,W1` — раскроет mixed indent + non-ASCII whitespace

Question 2

TabError: inconsistent use of tabs and spaces in indentation

Accepted Answer

PEP 8 рекомендует исключительно пробелы (4 на уровень). Python 3 строже Python 2 и эмитит TabError при любой смеси tab+space внутри одного логического блока. Часто причина — IDE с автоматическим преобразованием (VS Code `editor.detectIndentation: true`) или унаследованный код, частично сконвертированный. Запустите `python -tt script.py` (Python 3 включает строгий режим по умолчанию; флаг сохранён для совместимости) Конвертируйте все tabs в spaces: `expand -t 4 file.py > file.py.tmp && mv file.py.tmp file.py` (UNIX) В VS Code: `Ctrl+Shift+P → Convert Indentation to Spaces`; в PyCharm: `Edit → Convert Indents → To Spaces` Добавьте pre-commit hook с `ruff format` или `black` — оба нормализуют отступы автоматически Проверьте `.editorconfig`: `indent_style = space`, `indent_size = 4`, `end_of_line = lf`

Question 3

NameError: name 'X' is not defined

Accepted Answer

Имя X не существует в текущей области видимости. Python разрешает имена по правилу LEGB (Local → Enclosing → Global → Built-in) и кидает NameError, если X не найден ни на одном уровне. Частые причины: typo, забытый import, переменная определена только в одной ветке if, использование переменной до её присваивания внутри функции (UnboundLocalError — подкласс NameError в Python 3.11+). Проверьте typo: запустите `ruff check --select F821` (undefined name) или `pyflakes file.py` Убедитесь, что переменная определена ДО первого использования (включая все ветки if/else) Проверьте импорт: `python -c "from module import X; print(X)"` — либо имя не существует, либо отсутствует в `__all__` Если переменная глобальная, но используется внутри функции — добавьте `global X` или `nonlocal X` (для замыканий) Используйте mypy с `--strict` или ruff `F` rules — они ловят undefined-name на этапе static-analysis

Question 4

TypeError: 'NoneType' object is not subscriptable

Accepted Answer

Объект, к которому применяется `[...]`, равен None. Python функция без явного `return` возвращает None — типичная причина: пропущенный return в одной из веток, обработка KeyError/IndexError с возвратом None, либо вызов метода dict.get() без default. Также возникает при цепочках `obj.method().another()` где промежуточный метод вернул None. Проверьте функцию-источник: каждая ветка должна возвращать значение явно — `return result` (не падать в неявный `return None`) Используйте `dict.get(key, default)` вместо `dict[key]` для безопасного доступа с fallback Добавьте guard: `if result is None: raise ValueError('expected non-None'); return result[...]` Включите mypy `--strict` + `Optional[Dict]` annotations — type checker поймает None-flow на этапе анализа Используйте walrus operator для inline-проверки: `if (val := func()) is not None: process(val[0])`

Question 5

ModuleNotFoundError: No module named 'X'

Accepted Answer

Модуль X не установлен в текущем virtual environment, либо установлен в другую Python-версию (например, system python3 vs venv python3.12). PYTHONPATH не включает директорию с модулем. Возможен конфликт с одноимённым local file (X.py в cwd shadowing installed package — Python ищет cwd первым). Активируйте правильный venv: `source .venv/bin/activate` (Linux/macOS) или `.venv\Scripts\activate` (Windows) Установите модуль: `pip install X` или быстрее через `uv pip install X` Проверьте sys.path: `python -c "import sys; print('
'.join(sys.path))"` — модуль должен быть в одной из директорий Проверьте конфликт имён: убедитесь, что в cwd нет файла `X.py` или директории `X/`, перекрывающих установленный пакет Если устанавливаете локальный пакет: `pip install -e .` из корня проекта с pyproject.toml

Question 6

ImportError: cannot import name 'Y' from 'X'

Accepted Answer

Имя Y не экспортируется из модуля X в установленной версии. Возможные причины: (1) Y был перенесён/переименован между версиями (например, `from collections import Mapping` → `from collections.abc import Mapping` в 3.10+); (2) старая версия X не имела Y; (3) ошибка в `__init__.py` (Y не реэкспортирован); (4) circular import — Y определён, но модуль ещё не дошёл до его создания. Проверьте версию пакета: `pip show X` и сравните с docs.python.org или changelog проекта Закрепите версию: `pip install 'X>=1.2,<2.0'` в requirements.txt или pyproject.toml `dependencies` Найдите символ: `python -c "import X; print([n for n in dir(X) if 'Y' in n])"` — может быть переименован Используйте miграционный alias: `try: from X import Y
except ImportError: from X.submodule import Y` Прочитайте changelog X между установленной и ожидаемой версией — breaking changes часто документированы

Question 7

ImportError: cannot import name 'X' (most likely due to a circular import)

Accepted Answer

Модули A и B импортируют друг друга на top-level. Когда A импортирует B, B пытается импортировать A — но A ещё не закончил инициализацию (его module dict частично пуст). Python видит `partially initialized module` и кидает ImportError. Архитектурный smell — обычно нарушение Single Responsibility или забытое выделение общего слоя. Переместите проблемный import внутрь функции/метода (lazy import) — модуль импортируется при первом вызове, когда оба готовы Используйте `if TYPE_CHECKING:` блок (PEP 484) для type-only импортов — не выполняется в runtime Выделите общий код в третий модуль C, который импортируют и A и B — устранит cycle архитектурно Применяйте dependency injection: вместо импорта класса передавайте его как параметр Проверьте граф зависимостей: `pydeps src/ --max-bacon 2 --pylib-all` визуализирует cycles в проекте

Question 8

RecursionError: maximum recursion depth exceeded

Accepted Answer

Python имеет жёсткий лимит глубины стека вызовов (`sys.getrecursionlimit()` — обычно 1000). Лимит защищает от stack overflow процесса. Python (CPython) НЕ оптимизирует tail calls, поэтому глубокая рекурсия не превращается в цикл автоматически. При обходе deep tree / linked list / parsing рекурсия достигает лимита. Перепишите алгоритм итеративно: используйте explicit stack/queue (`collections.deque`) вместо вызова себя Увеличьте лимит осторожно: `sys.setrecursionlimit(10000)` — но риск real stack overflow процесса (segfault) Запустите в потоке с увеличенным stack size: `threading.Thread(target=fn).start()` после `threading.stack_size(64*1024*1024)` Используйте генераторы вместо рекурсии для lazy iteration: `yield from` делегирует без углубления стека Для динамики используйте memoization (`@functools.lru_cache`) — уменьшает число рекурсивных вызовов экспоненциально

Question 9

MemoryError (or unbounded memory growth)

Accepted Answer

Утечка памяти — объекты не освобождаются GC из-за reference cycle или удерживания в long-lived collection (cache, list, dict). Также частая причина: чтение большого файла целиком (`f.read()`) вместо потокового; использование list comprehension там, где нужен generator. Reference cycle с `__del__` методом блокирует cyclic GC до Python 3.4. Профилируйте: `python -m tracemalloc script.py` или `pip install memory-profiler && mprof run script.py` Замените list comprehension на generator: `(x*2 for x in data)` вместо `[x*2 for x in data]` для streaming Читайте файлы потоково: `for line in open(path): ...` не загружает весь файл в RAM Очищайте long-lived caches явно: `cache.clear()` или используйте `weakref.WeakValueDictionary` Запустите cyclic GC принудительно: `import gc; gc.collect()` — освобождает reference cycles

Question 10

KeyError: '<key>'

Accepted Answer

Ключ отсутствует в dict. CPython реализует dict через open-addressing hash table (PEP 468 compact dict с Python 3.6+). При лишнем `[]` без проверки наличия Python кидает KeyError. Частые причины: typo в имени ключа, несоответствие schema (API вернул другую структуру), case mismatch (`'User_ID'` vs `'user_id'`), JSON deserializeрует `null` в `None` (ключ есть, но значение None). Используйте `dict.get(key, default)` для безопасного доступа: `d.get('user_id', 0)` возвращает 0 если ключа нет Проверьте наличие явно: `if key in d: process(d[key])` — Pythonic check, O(1) lookup Используйте `collections.defaultdict(list)` для аккумуляции: создаёт default при первом обращении Применяйте `dataclasses` или `pydantic.BaseModel` для structured data — валидация schema на этапе создания Проверяйте API response: `assert 'user_id' in response, f'Unexpected schema: {list(response.keys())}'`

Question 11

IndexError: list index out of range

Accepted Answer

Индекс i выходит за границы списка [0, len(lst)). CPython list реализован как dynamic array (PyListObject с over-allocation): хранит ob_item (массив указателей) и Py_SIZE (текущая длина). При `lst[i]` Python проверяет `0 <= i < Py_SIZE` (с поддержкой negative indexing) и кидает IndexError если нарушено. Частые причины: off-by-one, пустой список, обращение к индексу после удаления элементов в цикле. Проверяйте границы явно: `if i < len(lst): process(lst[i])` — defensive programming Используйте `try/except IndexError` для graceful fallback на default-значение Применяйте slicing — он не кидает IndexError: `lst[i:i+1]` возвращает [] если i вне границ Для итерации используйте `for item in lst` или `enumerate(lst)` — Python сам управляет индексом Не модифицируйте список во время итерации: создайте новый или используйте `lst[:] = [x for x in lst if cond]`

Question 12

Mutable default argument trap (def f(x=[])):

Accepted Answer

Default arguments вычисляются ОДИН раз на этапе определения функции (когда `def` выполняется), а не при каждом вызове. Для immutable types (int, str, tuple) это безопасно. Для mutable (list, dict, set) — один и тот же объект разделяется между всеми вызовами. CPython хранит defaults в `func.__defaults__` tuple — модификация мутабельного default видна всем последующим вызовам. Используйте sentinel `None` и создавайте mutable внутри: `def f(x=None): x = [] if x is None else x` Для dataclasses используйте `field(default_factory=list)` вместо `field(default=[])` Включите ruff rule `B006` (`mutable-argument-default`) или pylint `W0102` — поймают на этапе lint Используйте type-immutable структуры: `tuple` вместо list, `frozenset` вместо set когда возможно Проверяйте `f.__defaults__` при отладке: содержит фактические default-объекты функции

Question 13

UnicodeDecodeError: 'utf-8' codec can't decode byte ... in position ...

Accepted Answer

Байты в файле не валидны как UTF-8 (либо файл в другой кодировке — cp1251/latin1/koi8-r, либо файл бинарный). Python 3 разделяет str (Unicode codepoints, PEP 393 flexible representation) и bytes. При `open(path)` без encoding Python использует `locale.getpreferredencoding()` — может отличаться от фактической кодировки файла. UnicodeDecodeError возникает на первом не-валидном байте. Всегда указывайте encoding явно: `open(path, encoding='utf-8')` (или `cp1251`, `latin1`) Определите кодировку: `pip install chardet && python -c "import chardet; print(chardet.detect(open(path,'rb').read(10000)))"` Используйте `errors='replace'` или `errors='ignore'` для tolerant чтения: `open(path, encoding='utf-8', errors='replace')` — заменит invalid bytes на U+FFFD Для смешанных данных читайте в bytes, декодируйте по chunks: `f.read().decode('utf-8', errors='strict')` Установите `PYTHONUTF8=1` для consistent UTF-8 mode (PEP 540) на всех OS

Question 14

TypeError: Cannot create a consistent method resolution order (MRO) for bases X, Y

Accepted Answer

Python 3 использует C3 linearization алгоритм (PEP 3119) для построения MRO. C3 требует, чтобы порядок базовых классов сохранялся монотонно во всей иерархии — `linearize(C(A, B)) = C + merge(linearize(A), linearize(B), [A, B])`. Если A и B в разных частях иерархии указаны в противоречивом порядке (A до B и B до A одновременно), merge не сходится — Python кидает TypeError. Типичный smell — diamond inheritance с противоречивыми порядками baz. Проверьте `Class.__mro__` каждого базового класса — найдите conflict: где A и B в разных порядках Перестройте иерархию: измените порядок базовых классов в одном из определений, чтобы согласовать с другим Используйте composition вместо multiple inheritance: agg.process() через `self.helper = HelperClass()` Применяйте mixins только для horizontal-функциональности, не для domain-классов Документируйте `super().__init__()` chain: каждый класс должен вызывать super, даже Mixins

Question 15

pyproject.toml: build-backend not found / Build backend missing

Accepted Answer

PEP 517 требует, чтобы pyproject.toml содержал секцию `[build-system]` с `requires` и `build-backend`. Без этой секции pip не знает, какой backend использовать для сборки sdist/wheel. Раньше setuptools был implicit-default, но PEP 517/518/621 сделали backend explicit. Частые причины: copy-paste pyproject.toml без [build-system], миграция со setup.py не завершена. Добавьте секцию [build-system] в pyproject.toml: `requires = ["setuptools>=61", "wheel"]` + `build-backend = "setuptools.build_meta"` Для hatchling (рекомендуется): `requires = ["hatchling"]` + `build-backend = "hatchling.build"` Для poetry: `requires = ["poetry-core>=1.0.0"]` + `build-backend = "poetry.core.masonry.api"` Установите backend в build-окружение: `pip install build && python -m build` создаст sdist+wheel в dist/ Проверьте: `pip install -e .` работает локально, потом — CI с `pip install build && python -m build && pip install dist/*.whl`

Question 16

pip install fails: ResolutionImpossible (dependency resolver conflict)

Accepted Answer

Pip resolver не выполняет полный backtracking SAT-solving (в отличие от uv / poetry). При несовместимых constraint'ах между transitive dependencies pip выбирает версии greedy и оставляет конфликт. PEP 440 version specifiers могут быть неоднозначны в edge-cases (например, `>=1.0` + `<2.0` + `!=1.5` через 3 пакета). Также проблема — заброшенные пакеты с устаревшими constraint'ами на зависимости. Используйте uv (рекомендуется): `pip install uv && uv pip install pkg` — Rust-based proper resolver, в 10-100× быстрее + полный backtracking Создайте чистое venv: `python -m venv .venv-clean && source .venv-clean/bin/activate && pip install pkg` Закрепите версии в lockfile: `pip install pip-tools && pip-compile requirements.in -o requirements.txt` Для production используйте `pyproject.toml` + `uv lock` — создаёт reproducible `uv.lock` со всеми transitive версиями В крайнем случае: `pip install --use-deprecated=legacy-resolver pkg` (быстрый, но небезопасный — оставит broken deps)

Question 17

venv activated wrong: which python returns global / system Python

Accepted Answer

Активация venv не выполнилась корректно. Возможные причины: (1) запущен `bash` поверх `zsh` после activate (parent shell сохраняет PATH); (2) использован Windows-стиль на Linux (`activate.bat` вместо `activate`); (3) прописан `alias python=...` в .bashrc, перекрывающий venv; (4) shell hash cache держит старый путь — нужен `hash -r`. activate работает через модификацию `$PATH` (добавляет .venv/bin в начало) и установку `$VIRTUAL_ENV`. Активируйте корректно для shell: bash/zsh — `source .venv/bin/activate`, fish — `source .venv/bin/activate.fish`, Windows PowerShell — `.venv\Scripts\Activate.ps1` После активации: `hash -r` (bash/zsh) — сбросит cache путей; `which python` должен показать `.venv/bin/python` Проверьте `$VIRTUAL_ENV`: `echo $VIRTUAL_ENV` должен совпадать с путём к venv Удалите конфликтующие aliases из shell rc: `unalias python pip` или закомментируйте в .bashrc/.zshrc Используйте direnv (`brew install direnv`) — автоматически активирует venv при входе в директорию через .envrc

Question 18

wheel build fails: missing C compiler / Python.h not found

Accepted Answer

Пакет содержит C extension (например, numpy, lxml, psycopg2-binary). PyPI обычно имеет prebuilt wheels для популярных платформ (manylinux, macos, win), но для редких комбинаций (musl, ARM, новый Python) wheel недоступен — pip собирает из sdist, требуя C compiler + Python development headers (Python.h в `python3-dev` пакете). Установите C build toolchain: Linux — `apt install build-essential python3-dev`; macOS — `xcode-select --install`; Windows — `pip install --upgrade pip` (обычно включает MSVC build tools) Используйте binary-only wheel: `pip install --only-binary :all: pkg` — pip не будет собирать из sdist Для psycopg2 используйте `psycopg2-binary` (precompiled wheel) вместо `psycopg2` На macos с Apple Silicon: `arch -arm64 pip install pkg` (для нативных wheels) или `arch -x86_64` через Rosetta Альтернатива — Docker с official python image: `docker run python:3.12-slim pip install pkg` (Linux build environment гарантирован)

Question 19

pytest: no tests ran (collected 0 items)

Accepted Answer

Pytest discovery работает по строгим конвенциям (можно переопределить через config): test files должны называться `test_*.py` или `*_test.py`; функции — `test_*`; классы — `Test*` (без `__init__`). Иначе pytest их игнорирует. Также: тесты в директории без `__init__.py` могут конфликтовать с rootdir; conftest.py не подхватывается, если он выше cwd. Переименуйте файлы: `my_tests.py` → `test_my.py`; функции `check_xxx()` → `test_xxx()` Запустите с verbose collection: `pytest --collect-only -q` — покажет, какие файлы найдены Проверьте rootdir: `pytest --rootdir=. -v` — pytest должен находить ваш pyproject.toml/setup.cfg как rootdir Настройте discovery через pyproject.toml: `[tool.pytest.ini_options]` + `testpaths = ["tests"]` + `python_files = ["test_*.py"]` Убедитесь, что conftest.py находится в rootdir или выше тестов; наличие `__init__.py` в test-директориях контролирует import mode

Question 20

pytest fixture 'X' not found / fixture scope mismatch

Accepted Answer

Pytest fixtures видны только в области их определения: fixture в `test_a.py` НЕ доступен в `test_b.py`. Для шаринга используется `conftest.py` — он автоматически подхватывается во всех тестах в этой и подпапках. ScopeMismatch — fixture с более широким scope (session) пытается использовать fixture с более узким (function): session-fixture создаётся раз на весь run, но запрашивает function-fixture, который пересоздаётся каждый тест. Перенесите общие fixtures в `tests/conftest.py` — будут доступны во всех тестах автоматически Не импортируйте fixtures явно — pytest сам их инжектит по имени параметра Согласуйте scopes: session > module > class > function. Fixture может зависеть только от равного или более широкого scope Проверьте структуру: `pytest --fixtures tests/` — покажет все доступные fixtures для конкретной директории Если нужна изоляция между тестами с session-scoped ресурсом — используйте truncate/reset внутри function-scoped wrapper

Question 21

mypy: incompatible types / Argument has incompatible type 'X', expected 'Y'

Accepted Answer

Mypy выполняет static type checking на основе annotations PEP 484/585/604. Python НЕ проверяет типы в runtime — это задача mypy/pyright. Несовместимость может означать реальный баг (передаём int вместо str) или ложное срабатывание (Optional не сужен через `is not None`, протокол не указан, generic не специализирован). Modern syntax (PEP 585 `list[int]`, PEP 604 `int | str`) требует Python 3.9+/3.10+ соответственно. Сузьте Optional: `if x is not None: f(x)` или `assert x is not None` — mypy понимает narrowing Используйте `cast(int, value)` или `# type: ignore[arg-type]` для целевых suppressions с обоснованием Установите stubs для third-party: `pip install types-requests types-pyyaml` или используйте `mypy --install-types` Включите `--strict-optional` и `--warn-return-any` постепенно — поэтапная миграция через per-file `[mypy-module.*]` Проверяйте локально перед commit: `mypy --strict src/` или интегрируйте в pre-commit hook

Question 22

Logging output not appearing (logger propagation pitfall)

Accepted Answer

Python logging построен на иерархии loggers (root → app → app.module). Каждый logger имеет уровень + handlers. Сообщение пропускается если: (1) уровень logger выше severity (`logger.warning('x')` при level=ERROR пропадёт); (2) handler уровень фильтрует ниже logger; (3) `logger.propagate = False` отключает bubbling к root; (4) handlers не привязаны (особенно к non-root logger). `logging.basicConfig()` работает только если root logger ещё без handlers — повторный вызов NoOp. Установите уровни корректно: `logging.getLogger().setLevel(logging.DEBUG)` (root) + handler с `setLevel(DEBUG)` Используйте `logging.basicConfig(level=DEBUG, force=True)` (Python 3.8+) — `force=True` пересоздаёт handlers Проверьте propagate: `logging.getLogger('app.module').propagate` — должно быть True (default) Дебаг иерархии: `logging.getLogger('app').handlers` и `.level` для каждого уровня цепочки Используйте `dictConfig` для централизации: `logging.config.dictConfig(config_dict)` гарантирует replication

Question 23

Slow loop performance — list.index() in a loop is O(n)

Accepted Answer

list реализован как dynamic array (PyListObject — contiguous PyObject* pointers). `lst.index(x)` и `x in lst` сканируют linear — O(n). Внутри цикла O(n) это превращается в O(n²) total. set/dict реализованы через hash table (open addressing) — `x in s` это O(1) amortized. Для повторяющихся membership-tests / lookups list — антипаттерн. Замените list на set для membership: `s = set(lst); for x in items: if x in s: ...` — O(1) per check Для key→value lookup используйте dict: `d = {item.id: item for item in lst}` — O(1) get Профилируйте: `python -m cProfile -s cumulative script.py | head -30` — раскроет O(n²) циклы Используйте `collections.Counter` для подсчёта частот: `Counter(items).most_common(10)` — O(n) total Микробенчмаркинг: `python -m timeit -s 'lst=list(range(10000))' '5000 in lst'` vs то же для set

Question 24

asyncio: RuntimeError: This event loop is already running

Accepted Answer

asyncio модель: только один event loop может быть active per thread в каждый момент. `asyncio.run()` создаёт НОВЫЙ loop, выполняет coroutine и закрывает — нельзя вложить в уже запущенный loop. Jupyter использует tornado/asyncio loop под капотом, поэтому `asyncio.run()` в cell конфликтует. Python 3.10+ deprecation: `get_event_loop()` без running loop кидает DeprecationWarning (3.12+ — ошибка). В Jupyter: `await coro()` напрямую (cell поддерживает top-level await) — не оборачивайте `asyncio.run()` Установите `nest-asyncio`: `pip install nest_asyncio && nest_asyncio.apply()` — патчит asyncio для re-entrancy Внутри запущенного loop используйте `asyncio.create_task(coro())` — добавит task в текущий loop В FastAPI / aiohttp: НЕ вызывайте `asyncio.run()` — фреймворк сам управляет loop Для верификации запущенности: `asyncio.get_running_loop()` (3.7+) кидает RuntimeError если loop неактивен — отличает от `get_event_loop()`

Question 25

GIL surprise: threading doesn't speed up CPU-bound work

Accepted Answer

GIL (Global Interpreter Lock) в CPython гарантирует, что только один поток выполняет Python bytecode в каждый момент. Для CPU-bound (чистый Python) threading НЕ даёт parallelism — потоки переключаются (каждые 100 bytecode инструкций или 5ms по умолчанию), но не работают параллельно. Threading помогает только для I/O-bound (network, disk) — пока один поток ждёт I/O, GIL отпускается для другого. C extensions могут отпускать GIL вручную (numpy operations). Для CPU-bound: используйте `multiprocessing.Pool` или `concurrent.futures.ProcessPoolExecutor` — каждый процесс имеет свой GIL Для I/O-bound: threading или asyncio — оба выпускают GIL во время I/O wait (asyncio предпочтительнее для high concurrency) Для numerical CPU-bound: NumPy / Polars / numba — операции выполняются в C без GIL (vectorized) Python 3.13t (free-threaded build, PEP 703) — экспериментальный no-GIL режим; production-ready ожидается 3.14+ Профилируйте GIL contention: `pip install py-spy && py-spy record --gil --rate 100 -- python script.py` — раскроет % времени GIL заблокирован

Область

Категория

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина

Решение

Связанные уроки:

Симптомы

Причина