Сеопфатна споредба на новообјавените o3-mini и DeepSeek R1 на OpenAI

OpenAI го објави својот најнов модел за заклучување, o3-мини, кој е оптимизиран за области како наука, математика и програмирање, обезбедувајќи побрз одговор, поголема прецизност и пониска цена.

Во споредба со својот претходник o1-mini, o3-mini значително ги подобри своите способности за заклучување, особено во решавањето сложени проблеми. Тестерите ги претпочитаат одговорите на o3-mini за 56%, а стапката на грешка е намалена за 39%. Од денес, ChatGPT Plus, тим и Про корисниците можат да користат o3-mini, и бесплатни корисници може да искусат и некои од неговите карактеристики.

Во споредба со моделот за заклучување DeepSeek-R1, само колку е подобро OpenAI o3-mini од R1?

Оваа статија најпрво ќе даде преглед на најважните моменти на o3-mini, а потоа ќе ги извлечеме податоците од двете страни на секој репер и ќе направиме график за визуелно да ги споредиме. Дополнително, ќе ја споредиме и цената на o3-mini.

Содржина

Основни моменти

1.СТЕМ оптимизација: се истакнува во областа на математиката, програмирањето, науката итн., особено надминувајќи го o1-mini во режимот на висок напор за заклучување.

2.Функции на програмери: поддржува функции како што се повици на функции, структуриран излез и пораки за развивачи за да се задоволат потребите на производната средина.

3.Брз одговор: 24% побрзо од o1-mini, со време на одговор од 7,7 секунди по барање.

4.Подобрување на безбедноста: обезбедува сигурен и сигурен излез преку технологијата за длабоко порамнување.

5.Економски: способностите за заклучување и оптимизацијата на трошоците одат рака под рака, со што значително го намалуваат прагот за употреба на вештачка интелигенција.

Споредете

Отворете вештачка интелигенција За да ја истакнете својата класа, нејзината официјален блог само го споредува со сопствените модели. Затоа, овој напис е табела извлечена од хартијата DeepSeek R1 и податоците од официјалниот блог OpenAI.

OpenAI официјално споредува o3-мини во списокот со верзии, разложувајќи го на три верзии: ниска, средна и висока, кои укажуваат на јачината на заклучоците. Бидејќи DeepSeek користи Math-500, а OpenAI користи база на податоци за Math, оваа споредба е отстранета овде.

Табелата е поинтуитивна, а Codeforces е отстранета бидејќи вредностите се премногу големи за да се прикажуваат интуитивно. Сепак, споредбата на Codeforces покажува дека високата јачина на заклучоци на o3-mini не е голема предност.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-клупа-Потврдено

Од табелата има вкупно 4 споредби, а О3-мини (високо) генерално води, но водството е многу мало.

Цена

модел	Влезна цена	Кеш хит	Излезна цена
o3-мини	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Резиме

Бидејќи DeepSeek R1 го активира DeepSeek Panic во Соединетите Држави, првиот што се почувствува загрозен беше OpenAI, што е особено видливо во цените на неговиот нов модел o3-mini.

Кога Openai o1 првпат беше објавен, неговата висока цена изврши притисок врз многу програмери и корисници. Појавата на DeepSeek R1 им даде на сите повеќе избор.Од 30-кратната разлика во цената помеѓу o1 и R1 до крајната цена на o3-mini што е двојно цена од DeepSeek R1,

го покажува влијанието на DeepSeek R1 на openai.Сепак, бесплатните корисници на ChatGPT можат да го искусат o3-mini само на ограничен начин, додека Deep Thinking на DeepSeek моментално е достапен за сите корисници.Исто така, со нетрпение очекувам openai да донесе повеќе водечки модели на ai и истовремено да ги намали трошоците за користење за корисниците.

Од перспектива на личното искуство на блогер со користење на R1, би сакал да кажам дека длабокото размислување на R1 секогаш ми го отвора умот. Препорачувам сите да го користат повеќе за да размислуваат за проблеми~

Некатегоризирано

Qwen2.5-max vs DeepSeek R1: Длабока споредба на модели: целосна анализа на сценаријата на апликацијата

Од страна наzddeepseeker 14 февруари 2025 година14 февруари 2025 година

Вовед Денес, големите јазични модели (LLMs) играат клучна улога. На почетокот на 2025 година, како што се засили конкуренцијата за вештачка интелигенција, Alibaba го лансираше новиот модел Qwen2.5-max AI, а DeepSeek, компанија од Хангжу, Кина, го лансираше моделот R1, кој го претставува врвот на технологијата LLM. Deepseek R1 е модел со вештачка интелигенција со отворен код кој привлече…

Некатегоризирано

Блиску е до DeepSeek-R1-32B и го скрши s1 на Fei-Fei Li! UC Berkeley и други нови модели на SOTA заклучоци со отворен код

Од страна наzddeepseeker 14 февруари 2025 година14 февруари 2025 година

Моделот за заклучување 32B користи само 1/8 од податоците и е врзан со DeepSeek-R1 со иста големина! Токму сега, институциите како што се Стенфорд, УК Беркли и Универзитетот во Вашингтон заеднички објавија модел за заклучување на ниво на SOTA, OpenThinker-32B, а исто така имаат отворен извор до 114k податоци за обука. Почетна страница на проектот OpenThinker: Лице гушкање OpenThinker:…

Некатегоризирано

OpenAI o3-mini наспроти DeepSeek-R1: Кој е кралот на новата генерација на модели со вештачка интелигенција?

Од страна наzddeepseeker 1 февруари 2025 година1 февруари 2025 година

o3-mini е тука, со динамика на предизвикувач На 31 јануари, OpenAI го објави сосема новиот голем модел o3-mini и обезбеди некои од неговите функции бесплатно на сите корисници на ChatGPT. Иако има ограничување на бројот на прашања, тоа им овозможува на корисниците да го искусат најновиот комерцијален модел на OpenAI што е можно поскоро….

Некатегоризирано

Paper-DeepSeek-R1: Поттикнување на способноста за расудување кај LLM преку учење за зајакнување

Од страна на1TP7 Тер 29 јануари 2025 година29 јануари 2025 година

Апстракт Овој труд ги воведува моделите за расудување од првата генерација на DeepSeek: DeepSeek-R1-Zero и DeepSeek-R1. DeepSeek-R1-Zero, обучен преку учење за засилување од големи размери (RL) без надгледувано фино подесување (SFT), покажува извонредни способности за расудување. Преку RL, природно развива моќни однесувања за расудување. Сепак, се соочува со предизвици како што се слаба читливост и мешање јазици. За да се решат овие проблеми и да се подобрат перформансите на расудувањето, развиен е DeepSeek-R1,…

Некатегоризирано

a16z дијалог со 27-годишен извршен директор: Агентот за вештачка интелигенција има огромен ефект на потпора, а долгорочните цени ќе бидат поврзани со трошоците за работна сила

Од страна наzddeepseeker 8 февруари 2025 година8 февруари 2025 година

Определување Агентот за вештачка интелигенција го преобликува искуството на клиентите Џеси Џанг: Како всушност се конструира агент? Нашиот став е дека со текот на времето, тој ќе станува се повеќе како агент заснован на природен јазик бидејќи на тој начин се обучуваат големите јазични модели (LLMs). На долг рок, ако имате супер интелигентен агент кој…

Некатегоризирано

DeepSeek-R1-0528 Ажурирање: Подлабоко размислување, посилно расудување

Од страна наzddeepseeker 29 мај 2025 година29 мај 2025 година

Моделот DeepSeek R1 претрпе мало надградување на верзијата, при што моменталната верзија е DeepSeek-R1-0528. Кога ќе влезете на веб-страницата или апликацијата DeepSeek, овозможете ја функцијата „Длабоко размислување“ во интерфејсот за дијалог за да ја доживеете најновата верзија. Тежините на моделот DeepSeek-R1-0528 се прикачени на HuggingFace Во текот на изминатите четири месеци, DeepSeek-R1 претрпе…

Основни моменти

Споредете

Цена

Резиме

Слични објави

Напишете коментар Откажи одговор