o3-mini е тук, с инерцията на претендент
На 31 януари OpenAI пусна чисто новия голям модел o3-mini и предостави някои от функциите му безплатно на всички потребители на ChatGPT. Въпреки че има ограничение на броя на заявките, това позволява на потребителите да се запознаят с най-новия търговски модел на OpenAI възможно най-скоро.
Само преди няколко дни DeepSeek, голяма компания за модели от Китай, пусна най-новия си модел с отворен код, DeepSeek-R1, който също е установил собствено влияние в общността на AI.
Моделът DeepSeek-R1 може да се сравнява с модела open ai o1, но е по-евтин. По-важното е, че DeepSeek R1 е модел с отворен код, което е най-голямата разлика в сравнение с openai.
Въпросът е: дали o3-mini наистина по-добре от DeepSeek-R1?
В официалното сравнение на данните, предоставено от OpenAI, са сравнени само някои от моделите, публикувани от OpenAI, и резултатите не са директно сравнени с тези на големите Модел DeepSeek R1. Въпреки това някои новопубликувани данни от сравнителни тестове показват, че o3-mini е малко по-добър в много отношения. Можем да разберем тази ситуация, като разгледаме резултатите от различни тестове.
Нека оставим данните да говорят сами за себе си и да анализираме в дълбочина истинската сила на тези два модела с изкуствен интелект. Понякога данните са едно, но по-често те зависят и от реалния опит и използването им от потребителя.
Сравнение на данните: o3-mini е по-интелигентен, но DeepSeek-R1 е по-"математически"
Общ среден резултат
OpenAI o3-mini: 73,94
DeepSeek-R1: 71.38
Ясно е, че общият резултат на o3-mini е малко по-висок, което показва, че той се справя по-стабилно с всеобхватни задачи. Той може да изпълнява задачите по-стабилно, но няма голяма разлика с модела с отворен код на DeepSeek.
Способност за разсъждаване (способността на ИИ да разбира, анализира и разсъждава върху информация).
OpenAI o3-mini: 89.58
DeepSeek-R1: 83.17
При задачите за разсъждаване o3-mini категорично печели, което означава, че той е по-добър в извличането на ключово съдържание от сложна информация и правенето на логически заключения.
Способност за програмиране (способността на ИИ да обработва код)
OpenAI o3-mini: 82.74
DeepSeek-R1: 66.74
Ако сте разработчик, o3-mini може да е по-добър избор. Резултатите показват голяма разлика, като способността за кодиране на o3-mini е значително по-добра от тази на DeepSeek-R1 и той може по-добре да разбира и решава проблеми, свързани с програмирането. Това също е област, в която o3-mini има сравнително голямо предимство
Математически способности (изчисляване, извеждане на формули, математическо мислене)
OpenAI o3-mini: 65.65
DeepSeek-R1: 79.54
DeepSeek-R1 е по-силен в математическите задачи, което показва, че е по-добър в числените изчисления и математическите разсъждения.
Умения за анализ на данни (способност за обработка и разбиране на данни)
OpenAI o3-mini: 70.64
DeepSeek-R1: 69.78
o3-mini има малка преднина при задачите за анализ на данни.
Умения за разбиране на езика
OpenAI o3-mini: 50.68
DeepSeek-R1: 48.53
Макар че предимството не е голямо, o3-mini все пак има леко превъзходство при езиковите задачи.
NYT Connections (пъзел)
o3-mini: 72,4 точки (отлично представяне)
DeepSeek-R1: 54,4 точки
Финален изпит за човека (сложна задача)
o3-mini: 13.0% точност
DeepSeek-R1: 9.4% точност
Codeforces (тест за умения за програмиране)
o3-mini > DeepSeek-R1 AIME 2024 (разбиране на сложни инструкции)
o3-mini > DeepSeek-R1 В обобщение, o3-mini е по-силен в областта на разсъжденията, програмирането и езиците, докато DeepSeek-R1 има повече предимства в областта на математическите способности.
Сравнение на цените на API: кой е по-рентабилен?
DeepSeek-R1 е по-евтин от гледна точка на цените на API, докато o3-mini все още е сравнително скъп:
DeepSeek-R1 е по-евтин и затова е подходящ за разработчици с ограничен бюджет.
Отворен и затворен код: OpenAI все още е със затворен код
Ако се интересувате от отворения код, DeepSeek-R1 е по-добър избор. Той е с напълно отворен код, докато o3-mini все още следва традицията на OpenAI и остава затворен. Това може да се отрази на свободата на разработчиците по отношение на оптимизацията и персонализирането на модела.
Окончателно заключение: кой е по-достоен за избор?
Размери | o3-mini (OpenAI) | DeepSeek-R1 |
Общ резултат | 73.94 | 71.38 |
Инференции | 89.58 (по-силен) | 83.17 |
Програмиране | 82.74 (по-силен) | 66.74 |
Математика | 65.65 | 79.54 |
Анализ на данните | 70.64 | 69.78 |
Разбиране на езика | 50.68 | 48.53 |
Цена на API | По-скъпо | по-евтино |
Отворен код | затворете | Напълно отворен код |
За кого е предназначен?
- Ако сте разработчик или инженер и нужда от силни възможности за програмиране и изводи, o3-mini е по-добрият избор. Смятаме, че open и O3mini имат много добри резултати в тази област на идентификация и изводи. В същото време по-мощните възможности за програмиране и извод могат да ви помогнат да напишете по-добър код и програми, като намалят времето за модификация и проверка
- Ако сте математически изследовател или сте чувствителни към разходите за API, DeepSeek-R1 е по-икономичен избор. Този модел има по-добра поддръжка и помощ за математическите изследователи и е с по-подходящи разходи за използване
- Ако имате нужда от модел с отворен код, DeepSeek-R1 е победителят. Очевидно е, че мета, който се фокусира върху отворения код, не е сравним с DeepSeek по някои възможности. Сравнимият голям модел openAI обаче е по-скъп и е търговски модел със затворен код. DeepSeek ще бъде водещ в изследванията и развитието на ИИ, като същевременно ще позволи на повече компании и индивидуални потребители да разгръщат големи модели на ИИ локално или на облачни сървъри, защитавайки сигурността и поверителността на своите данни
Бъдещи перспективи: конкуренцията за модели с изкуствен интелект се засилва
Както OpenAI, така и DeepSeek са двигател на развитието на технологията за изкуствен интелект. Въпреки че в момента o3-mini е малко по-добър в повечето задачи, DeepSeek-R1 все още има своите уникални предимства.
Отвореният код на DeepSeek привлече вниманието на много разработчици и потребители. По-ниската цена също създава добра основа за разработване на приложения с изкуствен интелект.
За разлика от тях OpenAI, като лидер в индустрията на изкуствения интелект, има много иновации и разработки, но неотвореният търговски модел и високата цена на използване са повишили прага за използване, което не е благоприятно за насърчаване на изкуствения интелект.
Смятаме, че deepseek е свършил чудесна работа за индустрията на изкуствения интелект. Отвореният код ще даде на разработчиците повече възможности да научат повече за усъвършенствания модел на AI.
В бъдеще може да се появят още по-мощни модели, като GPT-5 или DeepSeek-R2 на OpenAI. За обикновените потребители най-добрият ИИ не е "най-силният" ИИ, а този, който най-добре отговаря на техните нужди. Когато избирате подходящ за вас модел на ИИ, трябва да вземете предвид собствените си сценарии на приложение и бюджет.