Išsamus "OpenAI" naujai išleistų "o3-mini" ir DeepSeek R1 palyginimas

"OpenAI" išleido naujausią išvadų modelį, o3-mini, kuris optimizuotas tokioms sritims kaip gamtos mokslai, matematika ir programavimas, užtikrina greitesnį atsaką, didesnį tikslumą ir mažesnes sąnaudas.

Palyginti su savo pirmtaku o1-mini, o3-mini gerokai patobulino savo išvadų darymo galimybes, ypač sprendžiant sudėtingus uždavinius. Testuotojai pirmenybę teikia o3-mini atsakymams 56%, o klaidų skaičius sumažėjo 39%. Nuo šiandien, ChatGPT Plus, Komanda ir Pro naudotojai gali naudoti o3-mini, o nemokami naudotojai taip pat galite išbandyti kai kurias jo funkcijas.

Palyginti su išvados modeliu DeepSeek-R1, kiek geriau yra "OpenAI" o3-mini nei R1?

Šiame straipsnyje pirmiausia apžvelgsime svarbiausius "o3-mini" aspektus, tada iš abiejų pusių ištrauksime duomenis apie kiekvieną lyginamąjį indeksą ir sudarysime grafiką, kad juos vizualiai palygintume. Be to, palyginsime ir "o3-mini" kainą.

Turinys

Pagrindiniai akcentai

1.STEM optimizavimas: išsiskiria matematikos, programavimo, gamtos mokslų ir kt. srityse, ypač pranokdamas o1-mini didelės išvados pastangų režimu.

2.Kūrėjo funkcijos: palaiko tokias funkcijas kaip funkcijų iškvietimai, struktūrizuota išvestis ir kūrėjų pranešimai, kad atitiktų gamybinės aplinkos poreikius.

3.Greitas atsakas: 24% greitesnis nei o1-mini, o vienos užklausos atsakymo laikas - 7,7 sekundės.

4.Saugumo gerinimas: užtikrina saugią ir patikimą išvestį, naudodamas gilaus išlyginimo technologiją.

5.Ekonomiškas: išvadų darymo galimybės ir sąnaudų optimizavimas neatsiejami, todėl labai sumažėja dirbtinio intelekto naudojimo slenkstis.

Palyginkite

Atviras dirbtinis intelektas Siekiant pabrėžti jo klasę, jo oficialus tinklaraštis lygina tik su savo modeliais. Todėl šiame straipsnyje pateikiama lentelė, ištraukta iš DeepSeek R1 dokumento ir duomenų iš oficialaus "OpenAI" tinklaraščio.

"OpenAI" oficialiai lygina o3-mini versijų sąraše, suskirstant jį į tris versijas: žemą, vidutinę ir aukštą, kurios nurodo išvados stiprumą. Kadangi DeepSeek naudoja "Math-500", o "OpenAI" - "Math" duomenų rinkinį, šis palyginimas čia pašalintas.

Diagrama yra intuityvesnė, o "Codeforces" buvo pašalinta, nes reikšmės yra per didelės, kad jas būtų galima rodyti intuityviai. Tačiau palyginimas pagal Codeforces rodo, kad o3-mini didelis išvadų stiprumas nėra didelis pranašumas.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Iš diagramos matyti, kad iš viso yra 4 palyginimai, o O3-mini (didelis) paprastai pirmauja, tačiau pranašumas yra labai nedidelis.

Kaina

modelis	Gamybos sąnaudų kaina	Buferinės atminties pataikymas	Produkcijos kaina
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
"Deepseek R1	$0.55	$0.14	$2.19

Santrauka

DeepSeek R1 sukėlus DeepSeek paniką Jungtinėse Valstijose, pirmoji grėsmę pajuto "OpenAI", o tai ypač akivaizdu nustatant naujojo modelio o3-mini kainą.

Kai "Openai o1" buvo išleista pirmą kartą, didelė jos kaina darė spaudimą daugeliui kūrėjų ir naudotojų. Atsiradus DeepSeek R1, visiems atsirado daugiau pasirinkimo galimybių.Nuo 30 kartų didesnio o1 ir R1 kainų skirtumo iki dvigubai didesnės galutinės o3-mini kainos DeepSeek R1 kaina,

rodo DeepSeek R1 poveikį openai.Tačiau "ChatGPT" nemokami naudotojai gali tik ribotai išbandyti "o3-mini", o "DeepSeek" "Deep Thinking" šiuo metu prieinamas visiems naudotojams.Taip pat tikiuosi, kad "openai" pateiks daugiau pirmaujančių ai modelių, kartu sumažindama naudotojų naudojimo išlaidas.

Iš asmeninės tinklaraštininko patirties naudojant "R1" perspektyvos norėčiau pasakyti, kad "R1" "Gilus mąstymas" visada atveria mano protą. Rekomenduoju visiems daugiau ja naudotis ir mąstyti apie problemas~

Uncategorized

Cathie Wood: DeepSeek tik pagreitina sąnaudų mažinimo procesą; keisis itin koncentruota rinkos struktūra, panaši į Didžiąją depresiją

PagalZddeepseeker 2025 m. vasario 8 d2025 m. vasario 8 d

Svarbiausi įvykiai Konkurencija su DeepSeek naudinga JAV Cathie Wood: manau, kad tai rodo, kad naujovių kaina smarkiai krenta ir kad ši tendencija jau prasidėjo. Pavyzdžiui, prieš DeepSeek dirbtinio intelekto mokymo kaina sumažėjo 75% per metus, o išvadų kaina netgi sumažėjo 85% iki…

Uncategorized

DeepSeek 1 paslaptis | DeepSeekMath ir GRPO informacija

PagalZddeepseeker 2025 m. vasario 9 d2025 m. vasario 9 d

Šiandien norėčiau pasidalinti straipsniu iš DeepSeek, pavadintu DeepSeekMath: matematinio samprotavimo ribų perkėlimas atviros kalbos modeliuose. Šiame straipsnyje pristatomas DeepSeekMath 7B, kuris iš anksto paruoštas DeepSeek-Coder-Base-v1.5 7B, pagrįstas 120B matematikos prieigos raktų rinkiniu, natūralia kalba ir kodo duomenimis. Modelis pasiekė stulbinantį balą 51,71 TP11T konkurenciniu lygiu…

Uncategorized

Jis yra artimas DeepSeek-R1-32B ir sutraiško Fei-Fei Li s1! UC Berkeley ir kiti atvirojo kodo nauji SOTA išvadų modeliai

PagalZddeepseeker 2025 m. vasario 14 d2025 m. vasario 14 d

32B išvados modelis naudoja tik 1/8 duomenų ir yra susietas su tokio paties dydžio DeepSeek-R1! Kaip tik dabar tokios institucijos kaip Stanfordas, UC Berkeley ir Vašingtono universitetas kartu išleido SOTA lygio išvadų modelį „OpenThinker-32B“ ir taip pat sukūrė iki 114 000 mokymo duomenų atviro kodo. „OpenThinker Project“ pagrindinis puslapis: „OpenThinker Hugging Face“:…

Uncategorized

„Google“ išleido tris naujus modelius vienu metu: „Gemini-2.0-Pro“ yra nemokama, turi puikų balą ir užima pirmąją vietą bei tinka koduoti ir apdoroti sudėtingus raginimus!

PagalZddeepseeker 2025 m. vasario 8 d2025 m. vasario 8 d

Dvynių 2.0 istorija įsibėgėja. Gruodžio mėn. „Flash Thinking Experimental“ versija kūrėjams atnešė veikiantį modelį su maža delsa ir dideliu našumu. Anksčiau šiais metais „Google AI Studio“ buvo atnaujintas 2.0 „Flash Thinking Experimental“, siekiant dar labiau pagerinti našumą, derinant „Flash“ greitį su patobulintomis išvadų galimybėmis. Praėjusią savaitę,…

Uncategorized

Karščiausios naujienos! DeepSeek tyrėjas internete atskleidžia: R1 mokymas truko tik dvi ar tris savaites, o per kinų Naujųjų metų šventę buvo pastebėta galinga R1 nulio raida.

PagalZddeepseeker 2025 m. vasario 4 d2025 m. vasario 4 d

Karščiausios naujienos! DeepSeek tyrėjas internete atskleidžia: R1 mokymai truko tik dvi ar tris savaites, o per kinų Naujųjų metų šventę buvo pastebėta galinga R1 nulio evoliucija. Tik dabar pastebėjome, kad DeepSeek tyrėjas Daya Guo atsakė į internautų klausimus apie DeepSeek R1 ir įmonės planus. eina į priekį. Galime pasakyti tik…

Uncategorized

DeepSeek R1 užėmė pirmąją vietą kūrybinio rašymo teste, o o3 mini buvo dar prastesnis nei o1 mini!

PagalZddeepseeker vasario 3, 2025 m.vasario 3, 2025 m.

DeepSeek R1 laimėjo kūrybinio apsakymo rašymo lyginamojo testo čempionatą, sėkmingai aplenkdamas ankstesnį dominuojantį žaidėją Claude 3.5 Sonnet! Lyginamasis testas Mokslininko Lecho Mazuro sukurtas lyginamasis testas nėra įprastas rašymo konkursas. Kiekvienas dirbtinio intelekto modelis turėjo parašyti 500 trumpų istorijų, o kiekvienoje istorijoje reikėjo sumaniai įtraukti...

Pagrindiniai akcentai

Palyginkite

Kaina

Santrauka

Panašios žinutės

Parašykite komentarą Atšaukti atsakymą