Обзор OpenAI o3-Pro

OpenAI o3-Pro — это флагманская модель ИИ, выпущенная 10 июня 2025 года, предназначенная для сложных задач, требующих глубокого анализа и точности. Она основана на o3, но использует больше вычислительных ресурсов для улучшенной производительности.

Основные особенности

1. Улучшенное пошаговое мышление

o3-Pro использует продвинутый процесс "цепочки мыслей" (chain-of-thought), разбивая сложные задачи на логические шаги, что снижает ошибки и повышает прозрачность ответов. Это делает модель особенно эффективной для задач в математике, программировании и науке.

2. Мультимодальные возможности

Модель поддерживает обработку текста и изображений, позволяя анализировать визуальные данные, такие как диаграммы, графики или фотографии (даже низкого качества). Например, o3-Pro может считывать серийные номера с изображений или определять дефекты на поверхностях. Однако генерация изображений не поддерживается.

3. Интеграция с инструментами

o3-Pro активно использует инструменты, включая веб-поиск, интерпретатор Python для вычислений, анализ файлов и персонализацию ответов с учетом памяти. Это позволяет модели выполнять многоэтапные рабочие процессы, такие как прогнозирование на основе данных или анализ сложных документов.

4. Высокая производительность на бенчмарках

AIME 2024 (математика): 93% точности (o3: 90%, o1-Pro: 86%).
GPQA Diamond (наука): 84% (o3: 81%, o1-Pro: 79%).
Codeforces (программирование): Elo 2748 (o3: 2517, o1-Pro: 1707). Эти результаты подтверждают превосходство o3-Pro в сложных технических задачах.

5. Повышенная точность и надежность

В тестах с участием экспертов o3-Pro получила более высокие оценки за ясность, полноту, следование инструкциям и точность по сравнению с o3 и o1-Pro. Модель снижает количество ошибок на 20% в сложных задачах.

6. Безопасность и выравнивание

o3-Pro использует метод "deliberative alignment" для оценки безопасности запросов, что позволяет выявлять скрытые намерения и предотвращать нежелательные ответы. Модель прошла обновленное обучение по безопасности с тысячами целевых отказных промптов.

Ограничения

Скорость ответа: o3-Pro работает медленнее, чем o1-Pro, из-за более глубокого анализа, что делает её менее подходящей для задач, где важна скорость.
Отсутствие некоторых функций: Не поддерживает генерацию изображений, Canvas и временные чаты (последнее из-за технической проблемы).
Высокая стоимость: В API цена составляет $20 за миллион входных токенов и $80 за миллион выходных токенов, что в 10 раз дороже o3.
Сложности с подсчетом объектов: Модель демонстрирует слабые результаты в задачах, связанных с подсчетом объектов и измерениями.

Применение

Наука и исследования: Анализ научных статей, генерация гипотез, работа с визуальными данными.
Программирование: Создание кода, отладка, решение задач на Codeforces.
Бизнес: Генерация финансовых отчетов, анализ данных, стратегическое планирование.
Образование: Помощь в решении сложных задач по математике, физике и другим дисциплинам.
Юриспруденция: Анализ сложных правовых документов и многоэтапные юридические запросы.

Доступность

o3-Pro доступна для подписчиков ChatGPT Pro и Team, а также через API. Пользователи Enterprise и Edu получат доступ в течение недели после релиза.

Вывод

o3-Pro — это мощный инструмент для профессионалов и исследователей, где точность важнее скорости. Несмотря на высокую стоимость и более медленную работу, модель оправдывает себя в сложных задачах, требующих глубокого анализа и надежности. Однако для повседневных задач или ситуаций, где важна скорость, лучше использовать o3 или o4-mini.

Репозитории

@mosregdata