o3-mini здесьс импульсом претендента
31 января OpenAI выпустил новую крупную модель o3-mini и предоставил некоторые ее функции бесплатно всем пользователям ChatGPT. Хотя количество запросов ограничено, это позволяет пользователям как можно скорее познакомиться с новейшей коммерческой моделью OpenAI.
Всего несколько дней назад DeepSeek, крупная модельная компания из Китая, выпустила свою последнюю модель с открытым исходным кодом DeepSeek-R1, которая также завоевала свое влияние в AI-сообществе.
Модель DeepSeek-R1 по своим возможностям соответствует модели open ai o1, но стоит дешевле. Что еще более важно, DeepSeek R1 - это модель с открытым исходным кодом, что является самым большим отличием от openai.
Вопрос в том, является ли o3-mini действительно лучше, чем DeepSeek-R1?
В официальном сравнении данных, предоставленном OpenAI, сравниваются только некоторые из моделей, выпущенных OpenAI, и результаты не сравниваются напрямую с результатами крупных Модель DeepSeek R1. Однако недавно опубликованные данные бенчмарк-тестов показывают, что по многим параметрам o3-mini немного лучше. Мы можем понять эту ситуацию, взглянув на результаты различных тестов.
Давайте предоставим данным говорить самим за себя и проанализируем истинную силу этих двух моделей ИИ. Иногда данные - это одно, но чаще всего они зависят от реального опыта и использования пользователем.
Сравнение данных: o3-mini умнее, но DeepSeek-R1 более "математичен"
Общий средний балл
OpenAI o3-mini: 73,94
DeepSeek-R1: 71.38
Очевидно, что общий балл o3-mini немного выше, что говорит о его более стабильной работе в комплексных задачах. Он может выполнять задачи более стабильно, но не имеет большого разрыва с моделью с открытым исходным кодом DeepSeek.
Способность к рассуждению (способность ИИ понимать, анализировать и рассуждать об информации)
OpenAI o3-mini: 89,58
DeepSeek-R1: 83.17
В заданиях на рассуждение o3-mini явно выигрывает, что означает, что он лучше извлекает ключевое содержание из сложной информации и делает логические умозаключения.
Способность к программированию (способность ИИ обрабатывать код)
OpenAI o3-mini: 82.74
DeepSeek-R1: 66.74
Если вы являетесь разработчиком, то o3-mini может оказаться лучшим выбором. Оценки показывают значительную разницу: по способности к кодированию o3-mini значительно опережает DeepSeek-R1, а также по способности лучше понимать и решать проблемы программирования. Это также область, в которой o3-mini имеет относительно большое преимущество
Математические способности (расчеты, выведение формул, математическое мышление)
OpenAI o3-mini: 65.65
DeepSeek-R1: 79.54
DeepSeek-R1 лучше справляется с математическими заданиями, что говорит о том, что он лучше справляется с числовыми вычислениями и математическими рассуждениями.
Навыки анализа данных (способность обрабатывать и понимать данные)
OpenAI o3-mini: 70.64
DeepSeek-R1: 69.78
o3-mini имеет небольшое преимущество в задачах анализа данных.
Навыки понимания языка
OpenAI o3-mini: 50,68
DeepSeek-R1: 48.53
Хотя преимущество не велико, o3-mini все же немного превосходит его в языковых задачах.
NYT Connections (пазл)
o3-mini: 72,4 балла (отличные показатели)
DeepSeek-R1: 54,4 балла
Итоговый экзамен по человеку (комплексное задание)
o3-mini: точность 13.0%
DeepSeek-R1: 9,4% точность
Codeforces (тест на пригодность к программированию)
o3-mini > DeepSeek-R1 AIME 2024 (комплексное понимание инструкций)
o3-mini > DeepSeek-R1 В итоге, o3-mini сильнее в рассуждениях, программировании и языках, в то время как DeepSeek-R1 имеет преимущество в математических способностях.
Сравнение цен на API: кто выгоднее?
DeepSeek-R1 дешевле по ценам API, в то время как o3-mini все еще относительно дорог:
DeepSeek-R1 стоит дешевле и поэтому подходит для разработчиков с ограниченным бюджетом.
Открытый исходный код против закрытого: OpenAI все еще закрыт
Если вас волнует вопрос открытого исходного кода, то DeepSeek-R1 - лучший выбор. Он полностью открыт, в то время как o3-mini следует традициям OpenAI и остается закрытым. Это может повлиять на свободу разработчиков в плане оптимизации и кастомизации модели.
Окончательный вывод: кто более достоин выбора?
Размер | o3-mini (OpenAI) | DeepSeek-R1 |
Общая оценка | 73.94 | 71.38 |
Инференция | 89,58 (сильнее) | 83.17 |
Программирование | 82.74 (сильнее) | 66.74 |
Математика | 65.65 | 79.54 |
Анализ данных | 70.64 | 69.78 |
Понимание языка | 50.68 | 48.53 |
Цена API | Дороже | дешевле |
Открытый исходный код | закрыть | Полностью открытый исходный код |
Для кого это?
- Если вы разработчик или инженер и нуждаться сильные возможности программирования и умозаключенийто лучшим выбором будет o3-mini. Мы считаем, что Open и O3mini обладают очень хорошими характеристиками в этой области идентификации и умозаключений. В то же время, более мощные возможности программирования и вывода могут помочь вам писать более качественный код и программы, сокращая время на модификацию и проверку.
- Если вы математический исследователь или чувствительны к стоимости API, DeepSeek-R1 является более экономичным выбором. Эта модель имеет лучшую поддержку и помощь для математических исследователей, а также более приемлемую стоимость использования
- Если вам нужен модель с открытым исходным кодомПобедителем становится DeepSeek-R1. Очевидно, что meta, ориентированная на открытый исходный код, не может сравниться с DeepSeek по некоторым возможностям. Однако сопоставимая крупная модель openAI стоит дороже и является коммерческой моделью с закрытым исходным кодом. DeepSeek возглавит исследования и разработки в области ИИ, позволяя большему числу компаний и индивидуальных пользователей развертывать большие модели ИИ локально или на облачных серверах, защищая безопасность и конфиденциальность своих данных.
Перспективы на будущее: конкуренция за модели ИИ обостряется
Как OpenAI, так и DeepSeek стимулируют развитие технологий искусственного интеллекта. Хотя o3-mini в настоящее время немного лучше справляется с большинством задач, у DeepSeek-R1 все же есть свои уникальные преимущества.
Открытый исходный код DeepSeek привлек внимание многих разработчиков и пользователей. Низкая цена также закладывает хорошую основу для разработки приложений искусственного интеллекта.
В отличие от этого, OpenAI, как лидер в индустрии ИИ, имеет много инноваций и разработок, но не открытая коммерческая модель и высокая стоимость использования повышают порог использования, что не способствует продвижению ИИ.
Мы считаем, что deepseek проделала большую работу для индустрии ИИ. Открытый исходный код даст разработчикам больше шансов узнать больше о продвинутой модели Ai.
В будущем мы можем увидеть появление еще более мощных моделей, таких как GPT-5 или DeepSeek-R2 от OpenAI. Для обычных пользователей лучший ИИ - это не самый "сильный" ИИ, а тот, который лучше всего соответствует их потребностям. При выборе подходящей вам модели ИИ необходимо учитывать сценарии применения и бюджет.