vibecode.wiki
RU EN
~/wiki / новости / выход-gpt-5-3-codex--рабочие-заметки-по-модели

Выход GPT-5.3-Codex — рабочие заметки по модели

◷ 4 мин чтения 06.02.2026

Следующий шаг

Открой бота или продолжай маршрут внутри раздела.

$ cd раздел/ $ open @mmorecil_bot

Статья -> план в ИИ

Отправь ссылку на эту статью в любой ИИ и получи план внедрения под свой проект.

Прочитай эту статью: https://vibecode.morecil.ru/ru/%D0%BD%D0%BE%D0%B2%D0%BE%D1%81%D1%82%D0%B8/%D0%B2%D1%8B%D1%85%D0%BE%D0%B4-gpt-5-3-codex--%D1%80%D0%B0%D0%B1%D0%BE%D1%87%D0%B8%D0%B5-%D0%B7%D0%B0%D0%BC%D0%B5%D1%82%D0%BA%D0%B8-%D0%BF%D0%BE-%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8/ Работай в контексте моего текущего проекта. Сделай план внедрения под мой стек: 1) что изменить 2) в каких файлах 3) риски и типичные ошибки 4) как проверить, что всё работает Если есть варианты, дай "быстрый" и "production-ready".
Как использовать
  1. Скопируй этот промпт и отправь в чат с ИИ.
  2. Прикрепи проект или открой папку репозитория в ИИ-инструменте.
  3. Попроси изменения по файлам, риски и короткий чеклист проверки.

GPT-5.3-Codex — новая версия Codex, в которой объединены:

  • кодинговые возможности GPT-5.2-Codex
  • рассуждение и профессиональные знания GPT-5.2

Модель работает примерно на 25% быстрее и рассчитана на длинные задачи: исследование, работу с инструментами, последовательное выполнение шагов.

Используется в Codex app, CLI, IDE и вебе. API — в процессе.


Что в этой версии принципиально нового

Одна модель вместо двух режимов

Раньше было заметно разделение:

  • модель для кода
  • модель для рассуждений

В GPT-5.3-Codex это объединено.
Код, анализ, проверка гипотез и дальнейшие правки идут в одном контексте, без ощущения «переключения».

На практике это выражается не в том, что ответы стали «умнее», а в том, что они стали последовательнее.

Самостоятельная разработка модели

Это первая версия Codex, которая активно использовалась для собственной разработки:

  • отладка обучения
  • анализ тестов и оценок
  • управление деплоем
  • диагностика проблем в проде

По поведению это заметно: модель аккуратнее работает с инфраструктурными задачами и лучше ориентируется в сложных, не изолированных сценариях.

Уровень изменений: агентная архитектура
Суть: Codex перестал быть инструментом для отдельных шагов и стал агентом, который может вести задачу целиком

Бенчмарки

GPT-5.3-Codex показывает лучшие результаты по нескольким ключевым тестам:

  • SWE-Bench Pro
    Реальные инженерные задачи, несколько языков, меньше загрязнений.
    Результат выше, чем у GPT-5.2 и GPT-5.2-Codex.
  • Terminal-Bench 2.0
    Проверяет умение работать в терминале.
    GPT-5.3-Codex — 77.3% точности против ~64% у предыдущей версии.
  • OSWorld-Verified
    Работа в визуальной desktop-среде.
    64.7% — заметный рост по сравнению с предыдущими моделями.
  • GDPval
    Профессиональные задачи (документы, таблицы, презентации).
    Уровень сопоставим с GPT-5.2, но в рамках более универсального агента.

Отдельно важно: модель достигает этих результатов с меньшим количеством токенов, то есть работает экономнее.

Веб и долгие задачи

Модель тестировали на длинных автономных сценариях — например, разработке игр, где агент:

  • итеративно улучшает результат
  • фиксит баги
  • дополняет механику
  • делает это на протяжении миллионов токенов

В более приземлённых задачах (лендинги, сайты) заметно:

  • адекватные дефолты
  • меньше «пустых» решений
  • более собранная структура без подробного ТЗ

Beyond coding

GPT-5.3-Codex рассчитан не только на код:

  • PRD
  • презентации
  • таблицы
  • анализ данных
  • пользовательские исследования
  • метрики

По GDPval видно, что модель уверенно справляется с такими задачами.
Важно, что это не отдельный режим — всё происходит в том же агентном контексте.

Интерактивная работа

Codex теперь чаще сообщает о ходе работы:

  • что делает
  • какие решения принимает
  • где находится сейчас

Можно вмешиваться по ходу задачи, не сбрасывая контекст.
Это снижает необходимость либо ждать финал, либо постоянно перезапускать диалог.

Личное ощущение

Самое заметное — стало меньше необходимости управлять агентом вручную.

Раньше:

  • задачу приходилось дробить
  • цель часто напоминать
  • постоянно проверять, не «уехал» ли контекст

Сейчас:

  • задачу можно формулировать шире
  • агент сам удерживает направление
  • контроль остаётся, но в меру

Работа становится менее напряжённой, особенно на длинных задачах

Что читать дальше