
o3-mini и o3-mini (high) будут выпущены сегодня.

Постоянные пользователи также получат o3-mini, а пользователи plus смогут использовать o3-mini (high).
o3-mini (high) примерно на 200 баллов выше, чем o1 по Codeforce, быстрее, чем o1, лучше справляется с кодированием и математикой, но стоимость все еще на уровне o1-mini.

Пользователи Plus могут использовать o3-mini 100 раз в день. Однако лимит использования o3-mini (высокий) нуждается в дополнительном подтверждении.
Некоторые нетизены сказали, что да, R1 настолько популярна, что Openai не может сдерживаться:


А ранее команда Alibaba Qwen выпустила qwen2.5-max в канун Нового года. Во время Праздника Весны все еще нужно катать, хахаха...
На самом деле, еще во время рождественской прямой трансляции, Openai объявила, что o3 mini будет доступен в начале 2025 года:


Нам все еще нужно поговорить о том, что такое o3 и o3-mini?
o3: Передовая модель умозаключений, которая превосходит все остальные в кодировании, математике и даже в эталонных тестах, ориентированных на AGI. Она устанавливает новую планку для интеллекта и решения проблем.
o3-mini: Экономичная версия o3, обеспечивающая превосходную производительность при очень низкой стоимости и скорости.
Эти модели вывели умозаключения на совершенно новый уровень, сделав возможными прорывы в решении сложных задач, требующих глубокого понимания и логики.
o3 - это три главных прорыва.
Способность к программированию: 71,7% точность в практическом программировании, 20% выше, чем o1. 2727 баллов по Codeforces, что уже превосходит человеческий уровень.
Математический уровень: точность почти 97% в отборочном туре математической олимпиады США. Даже самые сложные задачи по математике Epic AI frontier позволяют получить результат 25%.
Самое удивительное - тест Arc AGI: 87,5%, впервые превзойдя человека в этом чрезвычайно сложном бенчмарк тесте.

Почему o3-mini является инновационной разработкой? o3-mini привносит два изменения.
Адаптивное мышление: глубину рассуждений можно регулировать в зависимости от сложности задания. На выбор предлагается три режима: низкий, средний и высокий.
Благодаря этому ИИ более точно соответствует реальным сценариям использования.
Прорыв в области экономичности: более низкая стоимость по сравнению с o1-mini, более быстрое реагирование и лучшие результаты.
Однако нетизены сетуют, что o3 high расходует $1 000 на одно задание:

Кроме того, моделей действительно слишком много, и нам еще предстоит выяснить, как переключаться между ними.
