DeepSeek R1 võrgus (tasuta|nologin)
Revolutsiooniline avatud lähtekoodiga tehisintellekti mudel täiustatud arutluseks, mis lööb Openai o1

DeepSeek R1 Vestlus online tasuta
DeepSeek R1 WEBGPU võrgus
Järgmise põlvkonna arutlusmudel, mis töötab lokaalselt teie brauseris koos WebGPU kiirendusega.
Te olete laadimas DeepSeek-R1-Distill-Qwen-1.5B, 1.5B parameetriga argumenteerivat LLM-i, mis on optimeeritud brauserisiseseks järeldamiseks. Kõik jookseb täielikult teie brauseris 🤗 Transformers.js ja ONNX Runtime Web abil, mis tähendab, et andmeid ei saadeta serverisse. Pärast laadimist saab seda kasutada isegi võrguühenduseta.

AI kodeerimisagent, mida toetab DeepSeek võrgus, kohe tasuta!
Boltnew.ai on powered By deepseek V3 , on koodide genereerimise vahend, selle tasuta nüüd!






Funktsioonidest pakitud DeepSeek R1 võrgus
Arhitektuur
Ehitatud MoE (ekspertide segu) 37B aktiivsete/671B koguparameetritega ja 128K kontekstipikkusega. Rakendab täiustatud tugevdavat õppimist, et saavutada enesekontroll, mitmeastmeline reflektsioon ja inimesega kooskõlastatud arutlusvõime.
Tulemuslikkus
Matemaatika: 97.3% täpsus MATH-500 puhul
Kodeerimine: Ületab 96.3% Codeforces osalejatest
Üldine põhjendus: 79,8% läbimise määr AIME 2024 (SOTA)
Need tulemused näitavad, et DeepSeek R1 üks parimaid tehisintellekti mudeleid maailmas.
Kasutuselevõtmine
API: OpenAI-ühilduv lõpp-punkt ($0.14/miljon tokenit)
Avatud lähtekood: MIT-litsentseeritud kaalud, 1,5B-70B destilleeritud variandid kaubanduslikuks kasutamiseks.
Leia see GitHubi repositoorium
Ökosüsteemi mudel
Variandid: Baas (R1-Zero), täiustatud (R1), 6 kerget destilleeritud mudelit.
Spetsialiseerumine: Optimeeritud keeruliste probleemide lahendamiseks, mitmekeelseks mõistmiseks ja tootmiskõlbliku koodi genereerimiseks.
Teekaart
Pidevad uuendused multimodaalseks toetuseks, vestluste täiustamiseks ja hajutatud järelduste optimeerimiseks, mis põhinevad avatud lähtekoodiga kogukonna koostööl.
Avatud lähtekood
Maailma esimene puhtalt RL-i poolt välja töötatud arutlusmudel koos avatud lähtekoodiga 32B kerge versiooniga saavutab GPT-4-taseme matemaatilise jõudluse aadressil 90% madalam hind
Mõtteahel visualiseerimine võimekus, tegelemine tehisintellekti "musta kasti" väljakutsetega

Mis on DeepSeek R1 võrgus?
DeepSeek R1 kujutab endast teedrajavat arengut tehisintellekti vallas, pakkudes tipptasemel jõudlust arutlus-, matemaatika- ja kodeerimisülesannete lahendamisel. See uuenduslik mudel demonstreerib juhtivate varaliste lahendustega võrreldavaid võimeid, säilitades samas täieliku avatud lähtekoodiga ligipääsetavuse.
Tehniline arhitektuur ja võimekus
Mudelarhitektuur
DeepSeek R1 kasutab keerukat MoE (Mixture of Experts) arhitektuuri, mis sisaldab:
- 37B aktiveeritud parameetrid
- 671B parameetrid kokku
- 128K konteksti pikkuse tugi
DeepSeek R1 raamistik sisaldab täiustatud tugevdava õppimise meetodeid, mis seab uued kriteeriumid tehisintellekti arutlusvõime osas.
Tulemuslikkuse võrdlusnäitajad
DeepSeek R1 on saavutanud märkimisväärseid tulemusi erinevates võrdlusuuringutes:
- MATH-500: 97,3% täpsus
- AIME 2024: 79,8% läbimise määr
- Koodijõud: 96.3% protsentuaalne järjestus
Need tulemused näitavad, et DeepSeek R1 üks parimaid tehisintellekti mudeleid maailmas.


Deepseeki mudelivariandid ja destilleerimine võrgus
Saadaval olevad versioonid
DeepSeek R1 on saadaval mitmes variandis:
- DeepSeek R1-Zero: baasmudel
- DeepSeek R1: Täiustatud versioon
- Mitu destilleeritud versiooni alates 1,5B kuni 70B parameetritega
Tulemuslikkuse optimeerimine
Mudel näitab erakordseid võimeid järgmistes valdkondades:
Keeruline probleemide lahendamine
Matemaatiline mõtlemine
Koodide genereerimine
Loomuliku keele mõistmine
DeepSeek-R1-Distill mudelid (allalaadimine võrgust)
Mudel | Baasmudel | Lae alla |
---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Math-1.5B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Lama-8B | Laama-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct | 🤗 HuggingFace |
leiad rohkem infot DeepSeek-R1-Distill mudelite kohta siin
Deepseek R1 hinnakujundus
Hinnakujundus Detail)
MUDEL(1) | KONTEKSTI PIKKUS | MAX COT TOKENS(2) | MAKSIMAALNE VÄLJUNDMÄRKIDE ARV(3) | 1M TOKENID SISSETÖÖÖTUSHINNAGA (CACHE HIT) (4) | 1M TOKENID SISSETÖÖÖTUSHINNAGA (CACHE MISS) | 1M TOKENID VÄLJUNDHIND |
---|---|---|---|---|---|---|
deepseek-chat | 64K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-põhjustaja | 64K | 32K | 8K | $0.14 | $0.55 | $2.19 (6) |
Hinnavõrdlus: DeepSeek R1 vs. OpenAI o1
1. DeepSeek R1 Hinnakujundus
DeepSeek R1 pakub väga konkurentsivõimelist hinnastruktuuri, mis teeb selle oluliselt taskukohasemaks kui OpenAI o1:
- Sisendmärgid (Cache Hit): $0.14 miljoni žetooni kohta
- Sisendmärgid (Cache Miss): $0.55 miljoni žetooni kohta
- Väljundmärgid: $2.19 miljoni žetooni kohta
Intelligentne vahemälusüsteem vähendab korduvate päringute kulusid, pakkudes kuni 90% kokkuhoid vahemälu tabamuste puhul25.
2. OpenAI o1 Hinnakujundus
Seevastu OpenAI o1 on tunduvalt kallim:
- Sisendmärgid: $15 miljoni žetooni kohta
- Väljundmärgid: $60 miljoni žetooni kohta
See muudab OpenAI o1 90-95% kallim kui DeepSeek R1 samaväärse kasutuse korral112.
3. Kulutõhusus
DeepSeek R1 hinnakujundus on 90-95% madalam kui OpenAI o1, pakkudes kuluefektiivset alternatiivi, ilma et see kahjustaks jõudlust. Näiteks:
- 1 miljon sisendmärki:
- DeepSeek R1: 0.14(cachehit)või0.14(cacheTeret)või0,55 (vahemälu kasutamata jätmine)
- OpenAI o1: $15
- 1 miljon väljundmärki:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Selline taskukohasus muudab DeepSeek R1 atraktiivseks valikuks arendajatele ja ettevõtetele1512.
4. Täiendavad eelised
- Avatud lähtekoodiga juurdepääs: DeepSeek R1 on saadaval MIT litsentsi alusel, mis võimaldab vaba kasutamist, muutmist ja kommertsialiseerimist512.
- API paindlikkus: DeepSeek R1 API toetab täiustatud funktsioone, nagu mõtteahela loogika ja pikkade kontekstide käsitlemine (kuni 128K märgid)212.


Blogid ja uudised Deepseek R1 ja Deepseek kohta veebis
-
DeepSeek on välja andnud oma lähtekoodi, FlashMLA üksikasjaliku selgituse
-
Mis on FlashMLA? Põhjalik juhend selle mõju kohta AI dekodeerimise tuumadele
-
Qwen2.5-max vs DeepSeek R1: mudelite põhjalik võrdlus: rakendusstsenaariumide täielik analüüs
-
See on DeepSeek-R1-32B lähedal ja purustab Fei-Fei Li s1! UC Berkeley ja muud avatud lähtekoodiga uued SOTA järeldusmudelid
1,Mis teeb DeepSeek-R1 arhitektuuri ainulaadseks?
- DeepSeek R1 kasutab Euroopa Parlamendi ja nõukogu süsteem 37B aktiivse/671B koguparameetriga ja 128K konteksti toetusega, mis on optimeeritud puhtalt tugevdava õppimise kaudu ilma juhitud peenhäälestuseta.
2. Kuidas on DeepSeek R1 hinnakujundus võrreldes OpenAI o1-ga?
- DeepSeek R1 kulud 90-95% vähem: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninputtokensvsOpenAIo1′s15, millel on samaväärne arutlusvõime.
3. Kas ma võin DeepSeek R1 kohalikult kasutusele võtta?
- Jah, DeepSeek R1 toetab kohalikku kasutuselevõttu vLLM/SGLangi kaudu ja pakub 6 destilleeritud mudelit (1,5B-70B parameetrit) piiratud ressurssidega keskkondade jaoks.
4. Millised võrdlusnäitajad tõestavad DeepSeek R1 jõudlust?
- Saavutab SOTA MATH-500 (97,3%), Codeforces (96,3% protsentiil) ja AIME 2024 (79,8%), ületades enamikku kommertsmudeleid.
5. Kas DeepSeek R1 on avatud lähtekoodiga?
- Jah, DeepSeek R1 on MIT-litsentsiga, mille täielik mudeli kaal on saadaval aadressil GitHub, mis võimaldab kaubanduslikku kasutamist ja muutmist.
6. Millised kognitiivsed võimed eristavad DeepSeek R1-i?
- Omadused enesekontroll ja mitmeastmeline peegeldus, keeruliste probleemide lahendamine nähtava mõtteahela kaudu.
7. Millistele tööstusharudele on DeepSeek R1 kõige kasulikum?
- Sobib ideaalselt tehisintellektiuuringuteks, ettevõtete koodide genereerimiseks, matemaatiliseks modelleerimiseks ja mitmekeelsete NLP-rakenduste jaoks, mis nõuavad täiustatud argumenteerimist.
8. Kuidas käsitleb DeepSeek R1 API-integratsiooni?
- Pakub OpenAI-ga ühilduvaid API-punkte 128K konteksti toega ja intelligentse vahemälu ($0,14/miljon tokenit vahemälu tabamuste jaoks).
9. Milliseid turvameetmeid rakendab DeepSeek R1?
- Sisseehitatud kordusjuhtimine (temperatuur 0,5-0,7) ja joondamismehhanismid hoiavad ära RL-treenitud mudelites levinud lõputud silmused.
10. Kust leian DeepSeek R1 tehnilise dokumentatsiooni?
Juurdepääs täielikele spetsifikatsioonidele DeepSeek R1 tehniline dokument ja API dokumendid.