The DeepSeek R1 mudel on läbinud väikese versiooniuuenduse ja praegune versioon on DeepSeek-R1-0528. DeepSeek veebilehele või rakendusse sisenedes lubage dialoogiboksis funktsioon „Deep Thinking“, et kogeda uusimat versiooni.
DeepSeek-R1-0528 mudeli kaalud on üles laaditud HuggingFace'i.

Viimase nelja kuu jooksul on DeepSeek-R1 läbinud superarengu, saavutades enneolematu kodeerimisvõime ja oluliselt pikema mõtlemisaja. Kuigi see ei pruugi olla parim DeepSeek-R2 Kõik ootasidki, et DeepSeek-R1-0528 mudeli täiustused on märkimisväärsed.
Aruannete kohaselt treenitakse uut mudelit DeepSeek-V3-0324 peal (parameetritega 660B).
Vaatame kõigepealt tabeli abil selle väljaande peamisi uuendusi.
Võimekuse mõõde | deepseek-R1 | Deepseek-R1-0528 |
Maksimaalne kontekst | 64k (API) | 128K (API) veelgi enam |
Koodi genereerimine | liveCodeBench sulgeb avatud O1 | O3 lähedal |
Arutluskäigu sügavus | Keerulised küsimused nõuavad segmenteeritud ülesandeid. | Toetab 30–60 minutit sügavat mõtlemist |
Keele loomulikkus | üsna pikk | Kompaktne struktuur, kirjutamisstiil sarnane O3-ga |
Kasutuskulu | Avatud lähtekoodiga või API$0.5/M | Avatud lähtekoodiga või API$0.5/M |
Täiustatud sügavmõtlemisvõime
DeepSeek-R1-0528 kasutab endiselt detsembris 2024 avaldatud DeepSeek V3 baasmudelit alusena, kuid järelkoolituse käigus investeeriti rohkem arvutusvõimsust, mis parandas oluliselt mudeli mõtlemise sügavust ja arutlusvõimet.
Uuendatud R1 mudel on saavutanud mitmetes võrdlusanalüüsides, sealhulgas matemaatikas, programmeerimises ja üldises loogikas, kõigi kodumaiste mudelite seas tipptasemel jõudluse ning selle üldine jõudlus on nüüd võrdne teiste rahvusvaheliste tippmudelitega, nagu o3 ja Gemini-2.5-Pro.
- Matemaatika ja programmeerimisoskused: AIME 2025 matemaatikavõistlusel paranes täpsus eelmise versiooni punktisummalt 70%-le 87,5%-le; koodi genereerimise võimekus LiveCodeBenchi võrdlustestis on peaaegu võrdne OpenAI o3-high mudeliga, saavutades punktisumma pass@1 73,3%.
Kasutajatestid näitavad, et uus DeepSeek-R1 on programmeerimises lihtsalt hämmastav!
Tehisintellekti ekspert „karminski-dentist“ testis sama ülesande abil nii DeepSeek-R1-0528 kui ka Claude 4 Sonnetit ning leidis, et:

Olgu selleks siis valguse hajus peegeldus seinal, palli liikumissuund pärast lööki või juhtpaneeli esteetiline välimus, R1 edestab konkurente selgelt.
Kasutaja Haider lasi mudelil luua sõnade hindamissüsteemi. R1 kaalus ülesannet lühidalt ja lõi kohe kaks faili – ühe koodi ja teise töö testimiseks –, mis töötasid esimesel katsel laitmatult.

Varem oli o3 ainus mudel, mis suutis seda ülesannet täita. Nüüd on R1 selle ülesande jaoks kahtlemata parim mudel.
Pane tähele, et R1 jõudlus on nii tähelepanuväärne, kuna kaks tagastatud faili töötavad esimesel katsel veatult, ilma igasuguse redigeerimise või uuesti proovimiseta, mis on äärmiselt haruldane.
Varem lõppes enamik mudeleid kas äärealadel, muutis lahenduse liiga keeruliseks või puudus piisav testide ulatus.
- Järelduste sügavus: ühe ülesande mõtlemisaeg pikenes 30–60 minutini, kusjuures keerukate probleemide lahendamise võimekus (nt füüsikasimulatsioonid, mitmeastmelised loogikamõistatused) on oluliselt paranenud.
Pikem mõtlemisaeg on muutunud veebis enim arutatud funktsiooniks. Mõned kasutajad teatasid, et R1 mõtlemisaeg ületas reaalsetes testides 25 minutit.

Lisaks näib see olevat ainus mudel, mis suudab järjepidevalt õigesti vastata küsimusele „Mis on 9,9 miinus 9,11?“.


DeepSeek-R1-0528 saavutas suurepärase jõudluse kõigil hindamisandmekogumitel
Võrreldes R1 eelmise versiooniga näitab uus mudel olulisi edusamme keerukates arutlusülesannetes. Näiteks AIME 2025 testis suurenes uue mudeli täpsusmäär 70%-lt 87,5%-le.
See paranemine tuleneb mudeli arutluskäigu süvenemisest: AIME 2025 testikomplektis kasutas vana mudel keskmiselt 12 000 žetooni küsimuse kohta, uus mudel aga keskmiselt 23 000 žetooni küsimuse kohta, mis näitab detailsemat ja põhjalikumat mõtlemist probleemide lahendamise protsessis.
Lisaks destilleeris deepseek meeskond DeepSeek-R1-0528-st pärineva arutlusahela ja peenhäälestas Qwen3-8B baasi, mille tulemuseks oli DeepSeek-R1-0528-Qwen3-8B.
See 8B mudel oli AIME 2024 matemaatikatestis teisel kohal vaid DeepSeek-R1-0528 järel, edestades Qwen3-8B-d (+10.0%) ja jäädes alla Qwen3-235B-le.
DeepSeek-R1-0528 arutlusahelatel on oluline mõju akadeemilisele uurimistööle arutlusmudelite ja väikesemahuliste mudelite tööstusliku arendamise kohta.
Mõned netikasutajad kiitsid DeepSeek-R1 võime eest parandada arutlusahelaid nagu o3 ja luua loomingulisi maailmu nagu Claude.

Oluline on märkida, et DeepSeek on avatud lähtekoodiga mudel, mis tähistab avatud lähtekoodiga mudelite suurt võitu.

AIME 2024 võrdlustulemused avatud lähtekoodiga mudelite, näiteks DeepSeek-R1-0528-Qwen3-8B kohta
Muud võimekuse uuendused
- Hallutsinatsioonide täiustamine: DeepSeek R1 uus versioon on optimeerinud jõudlust hallutsinatsioonidega seotud probleemide korral. Võrreldes eelmise versiooniga saavutab uuendatud mudel hallutsinatsioonide esinemissageduse vähenemise 45–50% võrra selliste ülesannete puhul nagu ümberkirjutamine ja lihvimine, kokkuvõtete tegemine ja lugemisoskuse parandamine, pakkudes täpsemaid ja usaldusväärsemaid tulemusi.
- Loovkirjutamine: Eelmise R1 versiooni põhjal on uuendatud R1 mudelit veelgi optimeeritud esseede, romaanide ja proosa kirjutamisstiilide jaoks, võimaldades luua pikemaid ja struktuurilt terviklikumaid teoseid, esitades samal ajal kirjutamisstiili, mis on paremini kooskõlas inimeste eelistustega.
- Tööriistade kutsumine: DeepSeek-R1-0528 toetab tööriistade kutsumist (mõtlemises tööriistade kutsumist ei toetata). Praeguse mudeli Tau-Benchi hindamisskoor on lennufirma puhul 53,5% ja jaemüügi puhul 63,9%, mis on võrreldav OpenAI o1-high-ga, kuid jääb siiski maha o3-High-st ja Claude 4 Sonnetist.
Näide kujutab veebiartikli kokkuvõtet, mis on loodud tööriista DeepSeek-R1-0528 kutsumisvõimaluse abil LobeChati kaudu. Lisaks on DeepSeek-R1-0528 uuendatud ja täiustatud sellistes valdkondades nagu esiotsa koodi genereerimine ja rollimängud.

Näide demonstreerib moodsat ja minimalistlikku sõnakaardirakendust, mis on loodud HTML/CSS/JavaScripti abil, kutsudes veebilehel esile DeepSeek-R1-0528.

DeepSeek-R1-0528 värskenduse põhipunktid
- Sügava mõtlemise võimekus, mis on võrreldav Google'i mudelitega
- Teksti genereerimise optimeerimine: loomulikum ja paremini vormindatud
- Ainulaadne arutlusstiil: mitte ainult kiirem, vaid ka rangem
- Pikaajalise mõtlemise toetamine: ühe ülesande töötlemisaeg võib ulatuda 30–60 minutini

Meie oleme testinud DeepSeek-R1 uue versiooni võimalusi. Kuigi tegemist on „väikese versiooni“ värskendusega, on selle jõudlust „eepiliselt“ parandatud.
Eriti programmeerimisvõimaluste osas tundub, et see on Claude 4 ja Gemini 2.5 Pro-st ette jõudnud või nendega samal tasemel. Kõik käsurea käsud on ühekordsed ega vaja mingeid muudatusi! Ja seda saab oma võimete demonstreerimiseks otse veebibrauseris käivitada.
Uue DeepSeek-R1 versiooni mõtteprotsess on selgelt tunda stabiilsem.
Võite deepseek-R1-lt küsida ükskõik millist küsimust, millele soovite vastust teada, isegi kui teie küsimus on pisut absurdne, mõtleb see ikkagi hoolikalt läbi ja korrastab loogikat. Soovitame tungivalt proovida uusimat deepseek-R1 mudelit.
API värskendusteave
API-t on uuendatud, kuid liides ja kutsumismeetodid on jäänud samaks. Uus R1 API toetab endiselt mudeli mõtlemisprotsessi vaatamist ning nüüd ka funktsioonide kutsumist ja JsonOutput'i.
deepseek meeskond on uues R1 API-s kohandanud parameetri max_tokens tähendust: max_tokens piirab nüüd mudeli üksiku väljundi kogupikkust (sh mõtlemisprotsess), vaikeväärtusega 32K ja maksimaalselt 64K. API kasutajatel soovitatakse parameetrit max_tokens kohe muuta, et vältida väljundi enneaegset kärpimist.
R1 mudeli kasutamise kohta leiate üksikasjalikke juhiseid aadressilt deepseek R1 API juhend:
Pärast seda R1 värskendust jääb mudeli konteksti pikkus ametlikul veebisaidil, miniprogrammis, rakenduses ja API-s 64K-ks. Kui kasutajad vajavad pikemat konteksti pikkust, saavad nad teiste kolmandate osapoolte platvormide kaudu kutsuda R1-0528 mudeli avatud lähtekoodiga versiooni, mille konteksti pikkus on 128K.
Avatud lähtekood
DeepSeek-R1-0528 kasutab sama baasmudelit kui eelmine DeepSeek-R1, täiustusi on tehtud ainult järeltreeningmeetodites.
Privaatjuurutamisel tuleb uuendada ainult kontrollpunkti ja tokenizer_config.json faili (tööriistakõnedega seotud muudatused). Mudeli parameetrid on 685 KB (millest 14 KB on MTP kihi jaoks) ja avatud lähtekoodiga versiooni konteksti pikkus on 128 KB (veebi, rakenduse ja API jaoks on ette nähtud 64 KB konteksti pikkus).