Kaip buvo sukurtas DeepSeek? DeepSeek augimo istorijos analizė

Kaip buvo sukurtas DeepSeek? DeepSeek augimo istorijos analizė

Ateityje bus vis daugiau griežtų naujovių. Dabar tai gali būti nelengva suprasti, nes visą socialinę grupę reikia šviesti faktais. Kai ši visuomenė leis žmonėms, diegiantiems hardcore inovacijas, pasiekti sėkmę, kolektyvinis mąstymas pasikeis. Mums tereikia krūvos faktų ir proceso....

DeepSeek tai padarė! "OpenAI" pripažįsta uždaro kodo klaidą, lyderio pranašumas tampa mažesnis

DeepSeek tai padarė! "OpenAI" pripažįsta uždaro kodo klaidą, lyderio pranašumas tampa mažesnis

Po to, kai "OpenAI" išleido "o3-mini" modelį, jos generalinis direktorius Samas Altmanas, vyriausiasis mokslinių tyrimų vadovas Markas Chenas, vyriausiasis produktų vadovas Kevinas Weilas, inžinerijos viceprezidentas Srinivas Narayananas, API mokslinių tyrimų vadovė Michelle Pokrass ir mokslinių tyrimų vadovas Hongyu Ren "reddit", viename didžiausių pasaulyje išsamių forumų, surengė internetinę techninę klausimų ir atsakymų konferenciją. Pagrindinės temos...

"OpenAI" o3-mini vs. DeepSeek-R1: kas yra naujos kartos dirbtinio intelekto modelių karalius?

"OpenAI" o3-mini vs. DeepSeek-R1: kas yra naujos kartos dirbtinio intelekto modelių karalius?

"o3-mini" jau čia, su iššūkio pagreičiu Sausio 31 d. "OpenAI" išleido visiškai naują "o3-mini" didelį modelį ir kai kurias jo funkcijas nemokamai suteikė visiems "ChatGPT" naudotojams. Nors užklausų skaičius ribojamas, tai leidžia naudotojams kuo greičiau išbandyti naujausią komercinį OpenAI modelį....

Pirmasis paleidimas! "SiliconFlow X Huawei Cloud" kartu pradeda teikti DeepSeek R1 ir V3 išvadų paslaugas, pagrįstas "Ascend Cloud"!

Pirmasis paleidimas! "SiliconFlow X Huawei Cloud" kartu pradeda teikti DeepSeek R1 ir V3 išvadų paslaugas, pagrįstas "Ascend Cloud"!

DeepSeek-R1 ir DeepSeek-V3 sukėlė pasaulinę sensaciją nuo pat jų atvirojo kodo paleidimo. Jie yra DeepSeek komandos dovana visai žmonijai, ir mes nuoširdžiai džiaugiamės jų sėkme. Po kelių dienų sunkaus "Silicon Mobility" ir "Huawei Cloud" komandų darbo, šiandien Kinijos naudotojams taip pat dovanojame kinišką...

Išsamus "OpenAI" naujai išleistų "o3-mini" ir DeepSeek R1 palyginimas

Išsamus "OpenAI" naujai išleistų "o3-mini" ir DeepSeek R1 palyginimas

"OpenAI" išleido naujausią išvadų modelį "o3-mini", optimizuotą tokioms sritims kaip gamtos mokslai, matematika ir programavimas, užtikrinantį greitesnį atsaką, didesnį tikslumą ir mažesnes sąnaudas. Palyginti su savo pirmtaku o1-mini, o3-mini gerokai pagerino išvadų darymo galimybes, ypač sprendžiant sudėtingus uždavinius. Testuotojai pirmenybę teikia o3-mini atsakymams 56%, o klaidų lygis sumažėjo...

AI srityje DeepSeek R1 fiziniuose testuose nuolat lenkia o1 ir Claude, ir mes įžengėme į RL aukso amžių.

Nė vienas iš mūsų nesitikėjo, kad taip prasidės 2025 m. dirbtinio intelekto srityje. DeepSeek R1 yra išties nuostabus! Pastaruoju metu "paslaptingoji Rytų galia" DeepSeek "sunkiai kontroliuoja" Silicio slėnį. Paprašiau R1 išsamiai paaiškinti Pitagoro teoremą. Visa tai dirbtinis intelektas padarė per mažiau nei 30 sekundžių be jokių...

Svarbiausios naujienos! Šiandien "OpenAI" išleido 2 naujus išvadų modelius: o3-mini ir o3-mini-high.

Svarbiausios naujienos! Šiandien "OpenAI" išleido 2 naujus išvadų modelius: o3-mini ir o3-mini-high.

o3-mini ir o3-mini (high) bus išleistos šiandien. Nuolatiniai naudotojai taip pat gaus o3-mini, o plius naudotojai galės naudoti o3-mini (high). o3-mini (high) yra maždaug 200 taškų aukštesnis už o1 Codeforce, greitesnis už o1 ir pasižymi geresniais kodavimo ir matematikos rezultatais, tačiau kaina vis dar yra o1-mini lygio....

Altmanas: klydome dėl atvirojo kodo dirbtinio intelekto! DeepSeek padarė OpenAI mažiau naudingą, o kitas yra GPT-5

Altmanas: klydome dėl atvirojo kodo dirbtinio intelekto! DeepSeek padarė OpenAI mažiau naudingą, o kitas yra GPT-5

o3-mini pasirodė vėlai vakare, o "OpenAI" pagaliau atskleidė savo naujausią kozirį. Per "Reddit AMA" klausimus ir atsakymus Altmanas giliai prisipažino, kad stovėjo ne toje pusėje, kurioje stovėjo atvirojo kodo AI. Jis sakė, kad atvirojo kodo vidinė strategija yra svarstoma ir modelis bus toliau kuriamas, tačiau...

Paper-DeepSeek-R1: Motyvavimo gebėjimų skatinimas LLM naudojant mokymąsi su pastiprinimu

Santrauka Šiame straipsnyje pristatomi DeepSeek pirmosios kartos samprotavimo modeliai: DeepSeek-R1-Zero ir DeepSeek-R1. DeepSeek-R1-Zero, apmokytas taikant didelio masto mokymąsi pastiprinant (angl. reinforcement learning, RL) be prižiūrimo derinimo (angl. supervised fine-tuning, SFT), demonstruoja puikius samprotavimo gebėjimus. Naudojant RL, jis natūraliai išvysto galingą samprotavimo elgseną. Tačiau jis susiduria su tokiomis problemomis kaip prastas skaitomumas ir kalbos maišymas. Siekiant išspręsti šias problemas ir pagerinti samprotavimo našumą, buvo sukurtas DeepSeek-R1,...