DeepSeek R1 võrgus (tasuta|nologin)

Revolutsiooniline avatud lähtekoodiga tehisintellekti mudel täiustatud arutluseks, mis lööb Openai o1

DeepSeek R1 Vestlus online tasuta

DeepSeek R1 WEBGPU võrgus

AI kodeerimisagent, mida toetab DeepSeek võrgus, kohe tasuta!

Funktsioonidest pakitud DeepSeek R1 võrgus

Arhitektuur

Ehitatud MoE (ekspertide segu) 37B aktiivsete/671B koguparameetritega ja 128K kontekstipikkusega. Rakendab täiustatud tugevdavat õppimist, et saavutada enesekontroll, mitmeastmeline reflektsioon ja inimesega kooskõlastatud arutlusvõime.

Tulemuslikkus

Matemaatika: 97.3% täpsus MATH-500 puhul
Kodeerimine: Ületab 96.3% Codeforces osalejatest
Üldine põhjendus: 79,8% läbimise määr AIME 2024 (SOTA)
Need tulemused näitavad, et DeepSeek R1 üks parimaid tehisintellekti mudeleid maailmas.

Kasutuselevõtmine

API: OpenAI-ühilduv lõpp-punkt ($0.14/miljon tokenit)
Avatud lähtekood: MIT-litsentseeritud kaalud, 1,5B-70B destilleeritud variandid kaubanduslikuks kasutamiseks.
Leia see GitHubi repositoorium

Ökosüsteemi mudel

Variandid: Baas (R1-Zero), täiustatud (R1), 6 kerget destilleeritud mudelit.
Spetsialiseerumine: Optimeeritud keeruliste probleemide lahendamiseks, mitmekeelseks mõistmiseks ja tootmiskõlbliku koodi genereerimiseks.

Teekaart

Pidevad uuendused multimodaalseks toetuseks, vestluste täiustamiseks ja hajutatud järelduste optimeerimiseks, mis põhinevad avatud lähtekoodiga kogukonna koostööl.

Avatud lähtekood

Maailma esimene puhtalt RL-i poolt välja töötatud arutlusmudel koos avatud lähtekoodiga 32B kerge versiooniga saavutab GPT-4-taseme matemaatilise jõudluse aadressil 90% madalam hind
Mõtteahel visualiseerimine võimekus, tegelemine tehisintellekti "musta kasti" väljakutsetega

Mis on DeepSeek R1 võrgus?

DeepSeek R1 kujutab endast teedrajavat arengut tehisintellekti vallas, pakkudes tipptasemel jõudlust arutlus-, matemaatika- ja kodeerimisülesannete lahendamisel. See uuenduslik mudel demonstreerib juhtivate varaliste lahendustega võrreldavaid võimeid, säilitades samas täieliku avatud lähtekoodiga ligipääsetavuse.

Tehniline arhitektuur ja võimekus

Mudelarhitektuur

DeepSeek R1 kasutab keerukat MoE (Mixture of Experts) arhitektuuri, mis sisaldab:

  • 37B aktiveeritud parameetrid
  • 671B parameetrid kokku
  • 128K konteksti pikkuse tugi

DeepSeek R1 raamistik sisaldab täiustatud tugevdava õppimise meetodeid, mis seab uued kriteeriumid tehisintellekti arutlusvõime osas.

Tulemuslikkuse võrdlusnäitajad

DeepSeek R1 on saavutanud märkimisväärseid tulemusi erinevates võrdlusuuringutes:

  • MATH-500: 97,3% täpsus
  • AIME 2024: 79,8% läbimise määr
  • Koodijõud: 96.3% protsentuaalne järjestus

Need tulemused näitavad, et DeepSeek R1 üks parimaid tehisintellekti mudeleid maailmas.

Deepseeki mudelivariandid ja destilleerimine võrgus

Saadaval olevad versioonid

DeepSeek R1 on saadaval mitmes variandis:

  • DeepSeek R1-Zero: baasmudel
  • DeepSeek R1: Täiustatud versioon
  • Mitu destilleeritud versiooni alates 1,5B kuni 70B parameetritega

Tulemuslikkuse optimeerimine

Mudel näitab erakordseid võimeid järgmistes valdkondades:

Keeruline probleemide lahendamine

Matemaatiline mõtlemine

Koodide genereerimine

Loomuliku keele mõistmine

DeepSeek-R1-Distill mudelid (allalaadimine võrgust)

MudelBaasmudelLae alla
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B🤗 HuggingFace
DeepSeek-R1-Distill-Lama-8BLaama-3.1-8B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B🤗 HuggingFace
DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Instruct🤗 HuggingFace

leiad rohkem infot DeepSeek-R1-Distill mudelite kohta siin

Deepseek R1 online on. Hämmastav!!

R1 kasutab OpenAI o1-ga võrdväärset puhast tugevdavat õppimist - 95% vähemate kuludega. ,selle hämmastav
Jimmy Smith

Deepseek R1 hinnakujundus

Hinnakujundus Detail)

MUDEL(1)KONTEKSTI PIKKUSMAX COT TOKENS(2)MAKSIMAALNE VÄLJUNDMÄRKIDE ARV(3)1M TOKENID
SISSETÖÖÖTUSHINNAGA
(CACHE HIT) (4)
1M TOKENID
SISSETÖÖÖTUSHINNAGA
(CACHE MISS)
1M TOKENID
VÄLJUNDHIND
deepseek-chat64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-põhjustaja64K32K8K$0.14$0.55$2.19 (6)

Hinnavõrdlus: DeepSeek R1 vs. OpenAI o1

1. DeepSeek R1 Hinnakujundus

DeepSeek R1 pakub väga konkurentsivõimelist hinnastruktuuri, mis teeb selle oluliselt taskukohasemaks kui OpenAI o1:

  • Sisendmärgid (Cache Hit): $0.14 miljoni žetooni kohta
  • Sisendmärgid (Cache Miss): $0.55 miljoni žetooni kohta
  • Väljundmärgid: $2.19 miljoni žetooni kohta

Intelligentne vahemälusüsteem vähendab korduvate päringute kulusid, pakkudes kuni 90% kokkuhoid vahemälu tabamuste puhul25.

2. OpenAI o1 Hinnakujundus

Seevastu OpenAI o1 on tunduvalt kallim:

  • Sisendmärgid: $15 miljoni žetooni kohta
  • Väljundmärgid: $60 miljoni žetooni kohta

See muudab OpenAI o1 90-95% kallim kui DeepSeek R1 samaväärse kasutuse korral112.

3. Kulutõhusus

DeepSeek R1 hinnakujundus on 90-95% madalam kui OpenAI o1, pakkudes kuluefektiivset alternatiivi, ilma et see kahjustaks jõudlust. Näiteks:

  • 1 miljon sisendmärki:
    • DeepSeek R1: 0.14(cachehit)või0.14(cacheTeret)või0,55 (vahemälu kasutamata jätmine)
    • OpenAI o1: $15
  • 1 miljon väljundmärki:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Selline taskukohasus muudab DeepSeek R1 atraktiivseks valikuks arendajatele ja ettevõtetele1512.

4. Täiendavad eelised

  • Avatud lähtekoodiga juurdepääs: DeepSeek R1 on saadaval MIT litsentsi alusel, mis võimaldab vaba kasutamist, muutmist ja kommertsialiseerimist512.
  • API paindlikkus: DeepSeek R1 API toetab täiustatud funktsioone, nagu mõtteahela loogika ja pikkade kontekstide käsitlemine (kuni 128K märgid)212.

Blogid ja uudised Deepseek R1 ja Deepseek kohta veebis

  • DeepSeek on välja andnud oma lähtekoodi, FlashMLA üksikasjaliku selgituse

  • Mis on FlashMLA? Põhjalik juhend selle mõju kohta AI dekodeerimise tuumadele

  • Qwen2.5-max vs DeepSeek R1: mudelite põhjalik võrdlus: rakendusstsenaariumide täielik analüüs

  • See on DeepSeek-R1-32B lähedal ja purustab Fei-Fei Li s1! UC Berkeley ja muud avatud lähtekoodiga uued SOTA järeldusmudelid

Vali muu keel deepseek R1 kohta

Korduma kippuvad küsimused deepseek-r1 kohta

1,Mis teeb DeepSeek-R1 arhitektuuri ainulaadseks?

  • DeepSeek R1 kasutab Euroopa Parlamendi ja nõukogu süsteem 37B aktiivse/671B koguparameetriga ja 128K konteksti toetusega, mis on optimeeritud puhtalt tugevdava õppimise kaudu ilma juhitud peenhäälestuseta.

2. Kuidas on DeepSeek R1 hinnakujundus võrreldes OpenAI o1-ga?

  • DeepSeek R1 kulud 90-95% vähem: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninputtokensvsOpenAIo1′s15, millel on samaväärne arutlusvõime.

3. Kas ma võin DeepSeek R1 kohalikult kasutusele võtta?

  • Jah, DeepSeek R1 toetab kohalikku kasutuselevõttu vLLM/SGLangi kaudu ja pakub 6 destilleeritud mudelit (1,5B-70B parameetrit) piiratud ressurssidega keskkondade jaoks.

4. Millised võrdlusnäitajad tõestavad DeepSeek R1 jõudlust?

  • Saavutab SOTA MATH-500 (97,3%), Codeforces (96,3% protsentiil) ja AIME 2024 (79,8%), ületades enamikku kommertsmudeleid.

5. Kas DeepSeek R1 on avatud lähtekoodiga?

  • Jah, DeepSeek R1 on MIT-litsentsiga, mille täielik mudeli kaal on saadaval aadressil GitHub, mis võimaldab kaubanduslikku kasutamist ja muutmist.

6. Millised kognitiivsed võimed eristavad DeepSeek R1-i?

  • Omadused enesekontroll ja mitmeastmeline peegeldus, keeruliste probleemide lahendamine nähtava mõtteahela kaudu.

7. Millistele tööstusharudele on DeepSeek R1 kõige kasulikum?

  • Sobib ideaalselt tehisintellektiuuringuteks, ettevõtete koodide genereerimiseks, matemaatiliseks modelleerimiseks ja mitmekeelsete NLP-rakenduste jaoks, mis nõuavad täiustatud argumenteerimist.

8. Kuidas käsitleb DeepSeek R1 API-integratsiooni?

  • Pakub OpenAI-ga ühilduvaid API-punkte 128K konteksti toega ja intelligentse vahemälu ($0,14/miljon tokenit vahemälu tabamuste jaoks).

9. Milliseid turvameetmeid rakendab DeepSeek R1?

  • Sisseehitatud kordusjuhtimine (temperatuur 0,5-0,7) ja joondamismehhanismid hoiavad ära RL-treenitud mudelites levinud lõputud silmused.

10. Kust leian DeepSeek R1 tehnilise dokumentatsiooni?

Juurdepääs täielikele spetsifikatsioonidele DeepSeek R1 tehniline dokument ja API dokumendid.