OpenAI го објави својот најнов модел за заклучување, o3-мини, кој е оптимизиран за области како наука, математика и програмирање, обезбедувајќи побрз одговор, поголема прецизност и пониска цена.
Во споредба со својот претходник o1-mini, o3-mini значително ги подобри своите способности за заклучување, особено во решавањето сложени проблеми. Тестерите ги претпочитаат одговорите на o3-mini за 56%, а стапката на грешка е намалена за 39%. Од денес, ChatGPT Plus, тим и Про корисниците можат да користат o3-mini, и бесплатни корисници може да искусат и некои од неговите карактеристики.

Во споредба со моделот за заклучување DeepSeek-R1, само колку е подобро OpenAI o3-mini од R1?
Оваа статија најпрво ќе даде преглед на најважните моменти на o3-mini, а потоа ќе ги извлечеме податоците од двете страни на секој репер и ќе направиме график за визуелно да ги споредиме. Дополнително, ќе ја споредиме и цената на o3-mini.
Основни моменти
1.СТЕМ оптимизација: се истакнува во областа на математиката, програмирањето, науката итн., особено надминувајќи го o1-mini во режимот на висок напор за заклучување.
2.Функции на програмери: поддржува функции како што се повици на функции, структуриран излез и пораки за развивачи за да се задоволат потребите на производната средина.
3.Брз одговор: 24% побрзо од o1-mini, со време на одговор од 7,7 секунди по барање.
4.Подобрување на безбедноста: обезбедува сигурен и сигурен излез преку технологијата за длабоко порамнување.
5.Економски: способностите за заклучување и оптимизацијата на трошоците одат рака под рака, со што значително го намалуваат прагот за употреба на вештачка интелигенција.
Споредете
Отворете вештачка интелигенција За да ја истакнете својата класа, нејзината официјален блог само го споредува со сопствените модели. Затоа, овој напис е табела извлечена од хартијата DeepSeek R1 и податоците од официјалниот блог OpenAI.
OpenAI официјално споредува o3-мини во списокот со верзии, разложувајќи го на три верзии: ниска, средна и висока, кои укажуваат на јачината на заклучоците. Бидејќи DeepSeek користи Math-500, а OpenAI користи база на податоци за Math, оваа споредба е отстранета овде.

Табелата е поинтуитивна, а Codeforces е отстранета бидејќи вредностите се премногу големи за да се прикажуваат интуитивно. Сепак, споредбата на Codeforces покажува дека високата јачина на заклучоци на o3-mini не е голема предност.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-клупа-Потврдено
Од табелата има вкупно 4 споредби, а О3-мини (високо) генерално води, но водството е многу мало.
Цена
модел | Влезна цена | Кеш хит | Излезна цена |
o3-мини | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
Резиме
Бидејќи DeepSeek R1 го активира DeepSeek Panic во Соединетите Држави, првиот што се почувствува загрозен беше OpenAI, што е особено видливо во цените на неговиот нов модел o3-mini.
Кога Openai o1 првпат беше објавен, неговата висока цена изврши притисок врз многу програмери и корисници. Појавата на DeepSeek R1 им даде на сите повеќе избор.Од 30-кратната разлика во цената помеѓу o1 и R1 до крајната цена на o3-mini што е двојно цена од DeepSeek R1,
го покажува влијанието на DeepSeek R1 на openai.Сепак, бесплатните корисници на ChatGPT можат да го искусат o3-mini само на ограничен начин, додека Deep Thinking на DeepSeek моментално е достапен за сите корисници.Исто така, со нетрпение очекувам openai да донесе повеќе водечки модели на ai и истовремено да ги намали трошоците за користење за корисниците.
Од перспектива на личното искуство на блогер со користење на R1, би сакал да кажам дека длабокото размислување на R1 секогаш ми го отвора умот. Препорачувам сите да го користат повеќе за да размислуваат за проблеми~