Svarbiausios naujienos! Šiandien "OpenAI" išleido 2 naujus išvadų modelius: o3-mini ir o3-mini-high.

o3-mini ir o3-mini (didelis) bus išleisti šiandien.

Nuolatiniai naudotojai taip pat gaus o3-mini, o "plus" naudotojai galės naudoti "o3-mini" (aukštą).

o3-mini (aukštas) yra maždaug 200 taškų aukštesnis už o1 Codeforce, greitesnis už o1, geriau atlieka kodavimo ir matematikos užduotis, tačiau kaina vis dar yra o1-mini lygio.

Be to, naudotojai gali naudoti "o3-mini" 100 kartų per dieną. Tačiau "o3-mini" naudojimo ribą (aukštą) reikia papildomai patvirtinti.

Kai kurie tinklaraštininkai sakė, kad taip, R1 yra toks populiarus, kad "Openai" negali susilaikyti:

Anksčiau "Alibaba Qwen" komanda Naujųjų metų išvakarėse išleido qwen2.5-max. Pavasario festivalio metu visiems vis dar reikia suktis, hahaha...

Tiesą sakant, jau per Kalėdų tiesioginę transliaciją, "Openai" paskelbė, kad "o3 mini" bus galima įsigyti 2025 m. pradžioje:

Turinys

Vis dar turime kalbėti apie tai, kas yra o3 ir o3-mini?

o3: Naujausias išvadų modelis, kuris puikiai atlieka kodavimo, matematikos ir net į AGI orientuotus lyginamuosius testus. Jis nustato naują intelekto ir problemų sprendimo etaloną.

o3-mini: Ekonomiška o3 versija, kuri užtikrina puikų našumą už labai mažą kainą ir greitį.

Šie modeliai perkėlė išvadas į visiškai naują lygmenį ir leido pasiekti proveržį sprendžiant sudėtingas užduotis, kurioms reikia gilaus supratimo ir logikos.

"o3" - tai trys svarbūs pasiekimai.

Programavimo gebėjimai: 71,7% praktinio programavimo tikslumas, 20% didesnis nei o1. 2727 taškai Codeforces, jau pranoksta žmogaus lygį.

Matematikos lygis: beveik 97% tikslumas JAV matematikos olimpiados atrankos etape. Net sudėtingiausių "Epic AI frontier" matematikos uždavinių rezultatai gali būti 25%.

Labiausiai stebina "Arc AGI" testas: 87,5%, pirmą kartą pranokęs žmones šiame itin sudėtingame lyginamajame teste.

Kodėl "o3-mini" yra perversmą sukelianti naujovė? "o3-mini" atneša du pokyčius.

Prisitaikantis mąstymas: mąstymo gilumą galima reguliuoti atsižvelgiant į užduoties sudėtingumą, galima rinktis iš trijų režimų: žemo, vidutinio ir aukšto.

Dėl to dirbtinis intelektas labiau atitinka realius naudojimo scenarijus.

Ekonominio efektyvumo proveržis: mažesnė kaina nei o1-mini, greitesnis atsakas ir geresni rezultatai.

Tačiau tinklaraštininkai apgailestauja, kad "o3 high" sunaudoja $1,000 vienai užduočiai:

Be to, iš tiesų yra per daug modelių ir dar turime patvirtinti, kaip juos perjungti.

Uncategorized

Atskleista DeepSeek-R1 technologija: išardomi pagrindiniai popieriaus principai ir atskleistas raktas į proveržio modelio veikimą

PagalZddeepseeker 2025 m. vasario 9 d2025 m. vasario 9 d

Šiandien pasidalinsime DeepSeek R1, pavadinimas: DeepSeek-R1: Mokymosi gebėjimų skatinimas LLM per stiprinimo mokymąsi: LLM samprotavimo gebėjimų skatinimas per stiprinimo mokymąsi. Šiame straipsnyje pristatomi pirmosios kartos DeepSeek samprotavimo modeliai DeepSeek-R1-Zero ir DeepSeek-R1. DeepSeek-R1-Zero modelis buvo apmokytas naudojant didelio masto sustiprinimo mokymąsi (RL) be prižiūrimo tikslaus derinimo (SFT) kaip pradinio žingsnio,…

Uncategorized

„Google“ išleido tris naujus modelius vienu metu: „Gemini-2.0-Pro“ yra nemokama, turi puikų balą ir užima pirmąją vietą bei tinka koduoti ir apdoroti sudėtingus raginimus!

PagalZddeepseeker 2025 m. vasario 8 d2025 m. vasario 8 d

Dvynių 2.0 istorija įsibėgėja. Gruodžio mėn. „Flash Thinking Experimental“ versija kūrėjams atnešė veikiantį modelį su maža delsa ir dideliu našumu. Anksčiau šiais metais „Google AI Studio“ buvo atnaujintas 2.0 „Flash Thinking Experimental“, siekiant dar labiau pagerinti našumą, derinant „Flash“ greitį su patobulintomis išvadų galimybėmis. Praėjusią savaitę,…

Uncategorized

Altmanas: klydome dėl atvirojo kodo dirbtinio intelekto! DeepSeek padarė OpenAI mažiau naudingą, o kitas yra GPT-5

PagalZddeepseeker vasario 1 d., 2025 m.vasario 1 d., 2025 m.

o3-mini pasirodė vėlai vakare, o "OpenAI" pagaliau atskleidė savo naujausią kozirį. Per "Reddit AMA" klausimus ir atsakymus Altmanas giliai prisipažino, kad stovėjo ne toje pusėje, kurioje stovėjo atvirojo kodo AI. Jis sakė, kad atvirojo kodo vidinė strategija yra svarstoma ir modelis bus toliau kuriamas, tačiau...

Uncategorized

Kas yra FlashMLA? Išsamus vadovas apie jo poveikį AI dekodavimo branduoliams

Pagaldeepseeker 2025 m. vasario 24 d2025 m. vasario 24 d

FlashMLA greitai sulaukė dėmesio dirbtinio intelekto pasaulyje, ypač didelių kalbų modelių (LLM) srityje. Šis naujoviškas įrankis, sukurtas DeepSeek, yra optimizuotas dekodavimo branduolys, sukurtas Hopper GPU – didelio našumo lustams, dažniausiai naudojamiems AI skaičiavimuose. „FlashMLA“ daugiausia dėmesio skiria efektyviam kintamo ilgio sekų apdorojimui, todėl ji ypač tinka…

Uncategorized

"OpenAI" o3-mini vs. DeepSeek-R1: kas yra naujos kartos dirbtinio intelekto modelių karalius?

PagalZddeepseeker vasario 1 d., 2025 m.vasario 1 d., 2025 m.

"o3-mini" jau čia, su iššūkio pagreičiu Sausio 31 d. "OpenAI" išleido visiškai naują "o3-mini" didelį modelį ir kai kurias jo funkcijas nemokamai suteikė visiems "ChatGPT" naudotojams. Nors užklausų skaičius ribojamas, tai leidžia naudotojams kuo greičiau išbandyti naujausią komercinį OpenAI modelį....

Uncategorized

DeepSeek-R1-0528 Atnaujinimas: Gilesnis mąstymas, stipresnis samprotavimas

PagalZddeepseeker gegužės 29 d., 2025 m.gegužės 29 d., 2025 m.

DeepSeek R1 modelis buvo šiek tiek atnaujintas ir dabartinė versija yra DeepSeek-R1-0528. Įėję į DeepSeek tinklalapį arba programėlę, dialogo sąsajoje įjunkite funkciją „Gilus mąstymas“, kad galėtumėte išbandyti naujausią versiją. DeepSeek-R1-0528 modelio svoriai buvo įkelti į „HuggingFace“. Per pastaruosius keturis mėnesius DeepSeek-R1 buvo atnaujintas…

Vis dar turime kalbėti apie tai, kas yra o3 ir o3-mini?

"o3" - tai trys svarbūs pasiekimai.

Kodėl "o3-mini" yra perversmą sukelianti naujovė? "o3-mini" atneša du pokyčius.

Panašios žinutės

Parašykite komentarą Atšaukti atsakymą