Murranguline uudis! OpenAI avaldas täna 2 uut järeldusmudelit: o3-mini ja o3-mini-high.

o3-mini ja o3-mini (kõrge) vabastatakse täna.

Tavakasutajad saavad ka o3-mini, ja pluss kasutajad saavad kasutada o3-mini (kõrge).

o3-mini (kõrge) on umbes 200 punkti kõrgem kui o1 Codeforce'il, kiirem kui o1 ja saavutab paremaid tulemusi kodeerimisel ja matemaatikas, kuid kulud on endiselt o1-mini tasemel.

Lisaks saavad kasutajad kasutada o3-mini 100 korda päevas. Siiski tuleb o3-mini (kõrge) kasutuspiirangut veel kinnitada.

Mõned netikodanikud ütlesid, et jah, R1 on nii populaarne, et Openai ei saa end tagasi hoida:

Ja varem, Alibaba Qwen meeskond avaldas uusaasta õhtul qwen2.5-max. Kevadfestivali ajal peavad kõik ikka veel veerema, hahaha...

Tegelikult juba jõulude ajal otseülekandes, Openai teatas, et o3 mini on saadaval 2025. aasta alguses:

Sisukord

Me peame veel rääkima, mis on o3 ja o3-mini?

o3: Tipptasemel järeldusmudel, mis paistab silma kodeerimise, matemaatika ja isegi AGI-le orienteeritud võrdlustestides. See seab uue mõõdupuu intelligentsuse ja probleemide lahendamise jaoks.

o3-mini: Kulutõhus o3 versioon, mis pakub parimat jõudlust väga madala hinna ja kiirusega.

Need mudelid on viinud järeldamise täiesti uuele tasemele, võimaldades läbimurdeid keerukates ülesannetes, mis nõuavad põhjalikku mõistmist ja loogikat.

o3 toob kaasa kolm olulist läbimurret.

Programmeerimisvõime: 71,7% täpsus praktilises programmeerimises, 20% kõrgem kui o1. 2727 punkti Codeforces, mis ületab juba inimese taset.

Matemaatika tase: peaaegu 97% täpsus USA matemaatikaolümpiaadi kvalifikatsioonivoorus. Isegi kõige keerulisemate Epic AI frontier matemaatikaülesannete puhul on võimalik saada 25% tulemusi.

Kõige hämmastavam on Arc AGI test: 87,5%, ületades esimest korda inimesi selles äärmiselt keerulises võrdlustestis.

Miks on o3-mini murranguline uuendus? o3-mini toob kaasa kaks muudatust.

Kohanduv mõtlemine: mõtlemise sügavust saab reguleerida vastavalt ülesande raskusastmele; valida saab kolme režiimi vahel: madal, keskmine ja kõrge.

See muudab tehisintellekti paremini vastavaks tegelikele kasutusstsenaariumidele.

Läbimurre kulutõhususes: madalamad kulud kui o1-mini, kiirem reageerimine ja paremad tulemused.

Kuid netikodanikud kurdavad, et o3 kõrge tarbib $1,000 ühe ülesande kohta:

Lisaks on tõepoolest liiga palju mudeleid ja me ei ole veel kinnitanud, kuidas nende vahel vahetada.

Mittekategoriseeritud

See on DeepSeek-R1-32B lähedal ja purustab Fei-Fei Li s1! UC Berkeley ja muud avatud lähtekoodiga uued SOTA järeldusmudelid

Autorzddeepseeker 14. veebruar 202514. veebruar 2025

32B järeldusmudel kasutab ainult 1/8 andmetest ja on seotud sama suurusega DeepSeek-R1-ga! Just praegu on sellised asutused nagu Stanford, UC Berkeley ja Washingtoni ülikool ühiselt välja andnud SOTA-taseme järeldusmudeli OpenThinker-32B ja on ka avatud lähtekoodiga kuni 114 000 koolitusandmeid. OpenThinker Projecti koduleht: OpenThinkeri kallistav nägu:…

Mittekategoriseeritud

DeepSeek-R1-0528 uuendus: sügavam mõtlemine, tugevam arutluskäik

Autorzddeepseeker 29. mai 202529. mai 2025

DeepSeek R1 mudel on läbinud väikese versiooniuuenduse, praegune versioon on DeepSeek-R1-0528. DeepSeek veebilehele või rakendusse sisenedes lubage dialoogiboksis funktsioon „Deep Thinking“, et kogeda uusimat versiooni. DeepSeek-R1-0528 mudeli kaalud on üles laaditud HuggingFace'i. Viimase nelja kuu jooksul on DeepSeek-R1 läbinud…

Mittekategoriseeritud

OpenAI äsja avaldatud o3-mini ja DeepSeek R1 põhjalik võrdlus

Autorzddeepseeker veebruar 1, 2025veebruar 1, 2025

OpenAI on välja andnud oma uusima järeldusmudeli o3-mini, mis on optimeeritud selliste valdkondade jaoks nagu teadus, matemaatika ja programmeerimine, pakkudes kiiremat reageerimist, suuremat täpsust ja väiksemaid kulusid. Võrreldes oma eelkäijaga o1-mini on o3-mini oluliselt parandanud järelduste tegemise võimekust, eriti keeruliste probleemide lahendamisel. Testijad eelistavad o3-mini vastuseid 56% ja veamäär on...

Mittekategoriseeritud

Mida suudab Deepseek saavutada? Isegi OpenAI ei saa sellega hakkama?

Autorzddeepseeker 10. veebruar 202510. veebruar 2025

DeepSeek tegelik väärtus on alahinnatud! DeepSeek-R1 on kahtlemata toonud turule uue entusiasmi laine. Mitte ainult asjakohased nn kasusaajate eesmärgid ei tõuse järsult, vaid mõned inimesed on isegi arendanud DeepSeek-ga seotud kursusi ja tarkvara, et sellega raha teenida. Usume, et kuigi neil nähtustel on…

Mittekategoriseeritud

a16z dialoog 27-aastase tegevjuhiga: AI agendil on tohutu võimendav mõju ja pikaajaline hinnakujundus on seotud tööjõukuludega

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Esiletõstetud AI Agent kujundab kliendikogemuse ümber Jesse Zhang: Kuidas agent tegelikult koostatakse? Meie seisukoht on, et aja jooksul muutub see üha enam loomuliku keelepõhise agendi sarnaseks, sest nii koolitatakse suuri keelemudeleid (LLM). Pikas perspektiivis, kui teil on ülitark agent, kes…

Mittekategoriseeritud

Ali Qwen2.5-Max edestab DeepSeek-V3! Netizen: Hiina tehisintellekt kahandab vahet kiiresti

Autorzddeepseeker 5. veebruar 20255. veebruar 2025

Just nüüd lisandus Ali Big Model Arena nimekirja veel üks kodumaine mudel Qwen2.5-Max, mis ületas DeepSeek-V3 ja saavutas üldarvestuses seitsmenda koha koguskooriga 1332. Samuti edestas see mudeleid nagu Claude 3.5 Sonnet ja Llama 3.1 405B ühes felllswoop. Eelkõige paistab see silma programmeerimises…

Me peame veel rääkima, mis on o3 ja o3-mini?

o3 toob kaasa kolm olulist läbimurret.

Miks on o3-mini murranguline uuendus? o3-mini toob kaasa kaks muudatust.

Sarnased postitused

Lisa kommentaar Tühista vastus