OpenAI o3-mini наспроти DeepSeek-R1: Кој е кралот на новата генерација на модели со вештачка интелигенција?

Содржина

О3-мини е тука, со моментум на предизвикувач

На 31 јануари, OpenAI го објави сосема новиот голем модел o3-mini и обезбеди некои од неговите функции бесплатно на сите корисници на ChatGPT. Иако има ограничување на бројот на прашања, тоа им овозможува на корисниците да го искусат најновиот комерцијален модел на OpenAI што е можно поскоро.

Пред само неколку дена, DeepSeek, голема компанија за модели од Кина, го објави својот најнов модел со отворен код, DeepSeek-R1, кој исто така воспостави свое влијание во заедницата за вештачка интелигенција.

Моделот DeepSeek-R1 има способност да одговара на отворениот ai o1 модел, но е поевтин. Уште поважно, DeepSeek R1 е модел со отворен код, што е најголема разлика во споредба со openai.

Прашањето е: е o3-мини навистина подобро од DeepSeek-R1?

Во официјалната споредба на податоци обезбедена од OpenAI, се споредуваат само некои од моделите објавени од OpenAI, а резултатите не се директно споредени со оние на големите Модел DeepSeek R1. Сепак, некои новообјавени податоци од репер тестовите покажуваат дека o3-mini е малку подобар на многу начини. Можеме да ја разбереме оваа ситуација со гледање на резултатите од различни тестови.

Да оставиме податоците да зборуваат сами за себе и длабински да ја анализираме вистинската сила на овие два модели на вештачка интелигенција. Понекогаш податоците се една работа, но почесто зависи и од вистинското искуство и употреба на корисникот.

Споредба на податоци: o3-mini е попаметен, но DeepSeek-R1 е по „математички“

Вкупен просечен резултат

OpenAI o3-mini: 73,94

DeepSeek-R1: 71,38

Јасно е дека вкупниот резултат на o3-mini е малку повисок, што укажува на тоа дека работи постабилно во сеопфатните задачи. Може да ги заврши задачите постабилно, но нема голема празнина со моделот со отворен код на DeepSeek.

Способност за расудување (способност на ВИ да разбере, анализира и расудува информациите)

OpenAI o3-mini: 89,58

DeepSeek-R1: 83,17

Во задачите за расудување, o3-mini јасно победува, што значи дека е подобро да ја извлече клучната содржина од сложени информации и да прави логични заклучоци.

Програмска способност (способност на ВИ да обработува код)

OpenAI o3-mini: 82,74

DeepSeek-R1: 66,74

Ако сте развивач, o3-mini може да биде подобар избор. Резултатите покажуваат голема разлика, со способноста за кодирање на o3-mini значително понапред од DeepSeek-R1 и може подобро да ги разбере и решава програмските проблеми. Ова е исто така област каде што o3-mini има релативно голема предност

Математичка способност (пресметка, изведување формула, математичко расудување)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79,54

DeepSeek-R1 е посилен при математички задачи, што покажува дека е подобар во нумеричките пресметки и математичкото расудување.

Вештини за анализа на податоци (способност за обработка и разбирање на податоците)

OpenAI o3-mini: 70,64

DeepSeek-R1: 69,78

o3-mini има мало водство во задачите за анализа на податоци.

Вештини за разбирање јазик

OpenAI o3-mini: 50,68

DeepSeek-R1: 48,53

Иако предноста не е голема, o3-mini сепак малку се подобри во јазичните задачи.

NYT Connections (загатка)

o3-mini: 72,4 поени (одлични перформанси)

DeepSeek-R1: 54,4 поени

Завршен испит за луѓе (комплексна задача)

o3-mini: 13,0% точност

DeepSeek-R1: 9,4% точност

Codeforces (тест за способност за програмирање)

o3-mini > DeepSeek-R1 AIME 2024 (комплексно разбирање на инструкциите)

o3-mini > DeepSeek-R1 Накратко, o3-mini е посилен во расудувањето, програмирањето и јазиците, додека DeepSeek-R1 е поповолен во математичката способност.

Споредба на цените на API: кој е поисплатлив?

DeepSeek-R1 е поевтин во однос на цените на API, додека o3-mini е сè уште релативно скап:

DeepSeek-R1 е поевтин и затоа е погоден за програмери со буџет.

Отворен код наспроти затворен извор: OpenAI е сè уште затворен

Ако сте загрижени за отворен код, DeepSeek-R1 е подобар избор. Тој е целосно со отворен код, додека o3-mini сè уште ја следи традицијата на OpenAI и останува затворен. Ова може да влијае на слободата на програмерите во однос на оптимизацијата и прилагодувањето на моделот.

Краен заклучок: кој е подостоен за избор?

Димензија	o3-mini (OpenAI)	DeepSeek-R1
Вкупен резултат	73.94	71.38
Заклучување	89,58 (посилно)	83.17
Програмирање	82,74 (посилно)	66.74
Математика	65.65	79.54
Анализа на податоци	70.64	69.78
Јазично разбирање	50.68	48.53
Цена на API	Поскапо	поевтино
Отворен код	затвори	Целосно отворен код

За кого е тоа?

Ако сте а инвеститорот или инженерот и потреба силни програмирачки и способности за заклучување, o3-mini е подобар избор. Сметаме дека open и O3mini имаат многу добри перформанси во оваа област на идентификација и заклучување. Во исто време, помоќните можности за програмирање и заклучоци можат исто така да ви помогнат да напишете подобар код и програми, намалувајќи го вашето време за модификација и проверка
Ако сте а математички истражувач или чувствителен на трошоците за API, DeepSeek-R1 е поекономичен избор. Овој модел има подобра поддршка и помош за математичките истражувачи и има посоодветни трошоци за употреба
Доколку ви треба еден модел со отворен код, DeepSeek-R1 е победник. Очигледно, мета, која се фокусира на отворен код, не е споредлива со DeepSeek во некои способности. Сепак, споредливиот openAI голем модел е поскап и е комерцијален модел со затворен код. DeepSeek ќе го води истражувањето и развојот на вештачката интелигенција, истовремено дозволувајќи им на повеќе компании и индивидуални корисници да распоредуваат големи модели со вештачка интелигенција локално или на облак сервери, заштитувајќи ја безбедноста и приватноста на нивните податоци

Идни изгледи: конкуренцијата за модели со вештачка интелигенција се интензивира

И OpenAI и DeepSeek го водат развојот на технологијата за вештачка интелигенција. Иако o3-mini моментално е малку подобар во повеќето задачи, DeepSeek-R1 сепак има свои уникатни предности.

Природата со отворен код на DeepSeek го привлече вниманието на многу програмери и корисници. Пониската цена, исто така, поставува добра основа за развој на апликации за вештачка интелигенција.

Спротивно на тоа, OpenAI, како лидер во индустријата за вештачка интелигенција, има многу иновации и развој, но неотворениот комерцијален модел и високата цена на користење го подигнаа прагот за употреба, што не е погодно за промоција на вештачката интелигенција.

Сметаме дека deepseek направи одлична работа за индустријата за вештачка интелигенција. Отворениот код ќе им даде на програмерите повеќе шанса да дознаат повеќе за напредниот модел Ai.

Во иднина, може да видиме појава на уште помоќни модели, како што се GPT-5 на OpenAI или DeepSeek-R2. За обичните корисници, најдобрата вештачка интелигенција не е „најсилната“ вештачка интелигенција, туку вештачката интелигенција која најдобро одговара на нивните потреби. При изборот на модел со вештачка интелигенција што ви одговара, мора да ги земете предвид вашите сопствени сценарија за апликација и буџет.

OpenAI o3-mini наспроти DeepSeek-R1: Кој е кралот на новата генерација на модели со вештачка интелигенција?

О3-мини е тука, со моментум на предизвикувач

Споредба на податоци: o3-mini е попаметен, но DeepSeek-R1 е по „математички“

Споредба на цените на API: кој е поисплатлив?

Отворен код наспроти затворен извор: OpenAI е сè уште затворен

Краен заклучок: кој е подостоен за избор?

Идни изгледи: конкуренцијата за модели со вештачка интелигенција се интензивира

DeepSeek го објави својот изворен код, детално објаснување за FlashMLA

Paper-DeepSeek-R1: Поттикнување на способноста за расудување кај LLM преку учење за зајакнување

Во кругот на вештачката интелигенција, DeepSeek R1 стабилно ги надмина o1 и Клод во физичките тестови и влеговме во златното доба на RL.

Евтиниот модел на Google, серијата Gemini 2.0, напаѓа: битката за исплатливост кај големите модели се интензивира

Qwen2.5-max vs DeepSeek R1: Длабока споредба на модели: целосна анализа на сценаријата на апликацијата

Le Chat е на врвот на топ листите, со инвестиции од сто милијарди долари. По САД и Кина, дали е тоа трета сила на вештачката интелигенција?

Напишете коментар Откажи одговор

О3-мини е тука, со моментум на предизвикувач

Споредба на податоци: o3-mini е попаметен, но DeepSeek-R1 е по „математички“

Споредба на цените на API: кој е поисплатлив?

Отворен код наспроти затворен извор: OpenAI е сè уште затворен

Краен заклучок: кој е подостоен за избор?

Идни изгледи: конкуренцијата за модели со вештачка интелигенција се интензивира

Слични објави

Напишете коментар Откажи одговор