o3-mini е тук, с инерцията на претендент

На 31 януари OpenAI пусна чисто новия голям модел o3-mini и предостави някои от функциите му безплатно на всички потребители на ChatGPT. Въпреки че има ограничение на броя на заявките, това позволява на потребителите да се запознаят с най-новия търговски модел на OpenAI възможно най-скоро.

Само преди няколко дни DeepSeek, голяма компания за модели от Китай, пусна най-новия си модел с отворен код, DeepSeek-R1, който също е установил собствено влияние в общността на AI.

Моделът DeepSeek-R1 може да се сравнява с модела open ai o1, но е по-евтин. По-важното е, че DeepSeek R1 е модел с отворен код, което е най-голямата разлика в сравнение с openai.

Въпросът е: дали o3-mini наистина по-добре от DeepSeek-R1?

В официалното сравнение на данните, предоставено от OpenAI, са сравнени само някои от моделите, публикувани от OpenAI, и резултатите не са директно сравнени с тези на големите Модел DeepSeek R1. Въпреки това някои новопубликувани данни от сравнителни тестове показват, че o3-mini е малко по-добър в много отношения. Можем да разберем тази ситуация, като разгледаме резултатите от различни тестове.

Нека оставим данните да говорят сами за себе си и да анализираме в дълбочина истинската сила на тези два модела с изкуствен интелект. Понякога данните са едно, но по-често те зависят и от реалния опит и използването им от потребителя.

Сравнение на данните: o3-mini е по-интелигентен, но DeepSeek-R1 е по-"математически"

Общ среден резултат

OpenAI o3-mini: 73,94

DeepSeek-R1: 71.38

Ясно е, че общият резултат на o3-mini е малко по-висок, което показва, че той се справя по-стабилно с всеобхватни задачи. Той може да изпълнява задачите по-стабилно, но няма голяма разлика с модела с отворен код на DeepSeek.

Способност за разсъждаване (способността на ИИ да разбира, анализира и разсъждава върху информация).

OpenAI o3-mini: 89.58

DeepSeek-R1: 83.17

При задачите за разсъждаване o3-mini категорично печели, което означава, че той е по-добър в извличането на ключово съдържание от сложна информация и правенето на логически заключения.

Способност за програмиране (способността на ИИ да обработва код)

OpenAI o3-mini: 82.74

DeepSeek-R1: 66.74

Ако сте разработчик, o3-mini може да е по-добър избор. Резултатите показват голяма разлика, като способността за кодиране на o3-mini е значително по-добра от тази на DeepSeek-R1 и той може по-добре да разбира и решава проблеми, свързани с програмирането. Това също е област, в която o3-mini има сравнително голямо предимство

Математически способности (изчисляване, извеждане на формули, математическо мислене)

OpenAI o3-mini: 65.65

DeepSeek-R1: 79.54

DeepSeek-R1 е по-силен в математическите задачи, което показва, че е по-добър в числените изчисления и математическите разсъждения.

Умения за анализ на данни (способност за обработка и разбиране на данни)

OpenAI o3-mini: 70.64

DeepSeek-R1: 69.78

o3-mini има малка преднина при задачите за анализ на данни.

Умения за разбиране на езика

OpenAI o3-mini: 50.68

DeepSeek-R1: 48.53

Макар че предимството не е голямо, o3-mini все пак има леко превъзходство при езиковите задачи.

NYT Connections (пъзел)

o3-mini: 72,4 точки (отлично представяне)

DeepSeek-R1: 54,4 точки

Финален изпит за човека (сложна задача)

o3-mini: 13.0% точност

DeepSeek-R1: 9.4% точност

Codeforces (тест за умения за програмиране)

o3-mini > DeepSeek-R1 AIME 2024 (разбиране на сложни инструкции)

o3-mini > DeepSeek-R1 В обобщение, o3-mini е по-силен в областта на разсъжденията, програмирането и езиците, докато DeepSeek-R1 има повече предимства в областта на математическите способности.

Сравнение на цените на API: кой е по-рентабилен?

DeepSeek-R1 е по-евтин от гледна точка на цените на API, докато o3-mini все още е сравнително скъп:

DeepSeek-R1 е по-евтин и затова е подходящ за разработчици с ограничен бюджет.

Отворен и затворен код: OpenAI все още е със затворен код

Ако се интересувате от отворения код, DeepSeek-R1 е по-добър избор. Той е с напълно отворен код, докато o3-mini все още следва традицията на OpenAI и остава затворен. Това може да се отрази на свободата на разработчиците по отношение на оптимизацията и персонализирането на модела.

Окончателно заключение: кой е по-достоен за избор?

Размериo3-mini (OpenAI)DeepSeek-R1
Общ резултат73.9471.38
Инференции89.58 (по-силен)83.17
Програмиране82.74 (по-силен)66.74
Математика65.6579.54
Анализ на данните70.6469.78
Разбиране на езика50.6848.53
Цена на APIПо-скъпопо-евтино
Отворен кодзатворетеНапълно отворен код

За кого е предназначен?

  • Ако сте разработчик или инженер и нужда от силни възможности за програмиране и изводи, o3-mini е по-добрият избор. Смятаме, че open и O3mini имат много добри резултати в тази област на идентификация и изводи. В същото време по-мощните възможности за програмиране и извод могат да ви помогнат да напишете по-добър код и програми, като намалят времето за модификация и проверка
  • Ако сте математически изследовател или сте чувствителни към разходите за API, DeepSeek-R1 е по-икономичен избор. Този модел има по-добра поддръжка и помощ за математическите изследователи и е с по-подходящи разходи за използване
  • Ако имате нужда от модел с отворен код, DeepSeek-R1 е победителят. Очевидно е, че мета, който се фокусира върху отворения код, не е сравним с DeepSeek по някои възможности. Сравнимият голям модел openAI обаче е по-скъп и е търговски модел със затворен код. DeepSeek ще бъде водещ в изследванията и развитието на ИИ, като същевременно ще позволи на повече компании и индивидуални потребители да разгръщат големи модели на ИИ локално или на облачни сървъри, защитавайки сигурността и поверителността на своите данни

Бъдещи перспективи: конкуренцията за модели с изкуствен интелект се засилва

Както OpenAI, така и DeepSeek са двигател на развитието на технологията за изкуствен интелект. Въпреки че в момента o3-mini е малко по-добър в повечето задачи, DeepSeek-R1 все още има своите уникални предимства.

Отвореният код на DeepSeek привлече вниманието на много разработчици и потребители. По-ниската цена също създава добра основа за разработване на приложения с изкуствен интелект.

За разлика от тях OpenAI, като лидер в индустрията на изкуствения интелект, има много иновации и разработки, но неотвореният търговски модел и високата цена на използване са повишили прага за използване, което не е благоприятно за насърчаване на изкуствения интелект.

Смятаме, че deepseek е свършил чудесна работа за индустрията на изкуствения интелект. Отвореният код ще даде на разработчиците повече възможности да научат повече за усъвършенствания модел на AI.

В бъдеще може да се появят още по-мощни модели, като GPT-5 или DeepSeek-R2 на OpenAI. За обикновените потребители най-добрият ИИ не е "най-силният" ИИ, а този, който най-добре отговаря на техните нужди. Когато избирате подходящ за вас модел на ИИ, трябва да вземете предвид собствените си сценарии на приложение и бюджет.

Подобни публикации

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *