o3-mini и o3-mini (high) будут выпущены сегодня.

Постоянные пользователи также получат o3-mini, а пользователи plus смогут использовать o3-mini (high).

o3-mini (high) примерно на 200 баллов выше, чем o1 по Codeforce, быстрее, чем o1, лучше справляется с кодированием и математикой, но стоимость все еще на уровне o1-mini.

Пользователи Plus могут использовать o3-mini 100 раз в день. Однако лимит использования o3-mini (высокий) нуждается в дополнительном подтверждении.

Некоторые нетизены сказали, что да, R1 настолько популярна, что Openai не может сдерживаться:

А ранее команда Alibaba Qwen выпустила qwen2.5-max в канун Нового года. Во время Праздника Весны все еще нужно катать, хахаха...

На самом деле, еще во время рождественской прямой трансляции, Openai объявила, что o3 mini будет доступен в начале 2025 года:

Нам все еще нужно поговорить о том, что такое o3 и o3-mini?

o3: Передовая модель умозаключений, которая превосходит все остальные в кодировании, математике и даже в эталонных тестах, ориентированных на AGI. Она устанавливает новую планку для интеллекта и решения проблем.

o3-mini: Экономичная версия o3, обеспечивающая превосходную производительность при очень низкой стоимости и скорости.

Эти модели вывели умозаключения на совершенно новый уровень, сделав возможными прорывы в решении сложных задач, требующих глубокого понимания и логики.

o3 - это три главных прорыва.

Способность к программированию: 71,7% точность в практическом программировании, 20% выше, чем o1. 2727 баллов по Codeforces, что уже превосходит человеческий уровень.

Математический уровень: точность почти 97% в отборочном туре математической олимпиады США. Даже самые сложные задачи по математике Epic AI frontier позволяют получить результат 25%.

Самое удивительное - тест Arc AGI: 87,5%, впервые превзойдя человека в этом чрезвычайно сложном бенчмарк тесте.

Почему o3-mini является инновационной разработкой? o3-mini привносит два изменения.

Адаптивное мышление: глубину рассуждений можно регулировать в зависимости от сложности задания. На выбор предлагается три режима: низкий, средний и высокий.

Благодаря этому ИИ более точно соответствует реальным сценариям использования.

Прорыв в области экономичности: более низкая стоимость по сравнению с o1-mini, более быстрое реагирование и лучшие результаты.

Однако нетизены сетуют, что o3 high расходует $1 000 на одно задание:

Кроме того, моделей действительно слишком много, и нам еще предстоит выяснить, как переключаться между ними.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *