DeepSeek R1 na spletu (brezplačno|brez prijave)

Revolucionarni odprtokodni model AI za napredno sklepanje, ki premaga Openai o1

DeepSeek R1 Klepetajte brezplačno

DeepSeek R1 WEBGPU na spletu

AI Coding Agent, ki ga poganja DeepSeek na spletu, brezplačno zdaj!

Na spletu je poln funkcij DeepSeek R1

Arhitektura

Zgrajeno na MoE (mešanica strokovnjakov) s 37B aktivnih/671B skupnih parametrov in 128K dolžino konteksta. Izvaja napredno okrepljeno učenje za doseganje samopreverjanja, večstopenjskega razmišljanja in zmožnosti razmišljanja, usklajenega s človekom.

Učinkovitost

matematika: 97,3% natančnost na MATH-500
Kodiranje: Prekaša 96.3% udeležencev Codeforces
Splošno sklepanje: 79,8% prehodna stopnja na AIME 2024 (SOTA)
Ti rezultati položaj DeepSeek R1 med najbolj zmogljivimi modeli AI na svetu.

Razporeditev

API: Končna točka, združljiva z OpenAI ($0,14/milijon žetonov)
Odprta koda: uteži z licenco MIT, destilirane različice 1,5B-70B za komercialno uporabo.
Poiščite ga v Repozitorij GitHub

Model ekosistema

Različice: Base (R1-Zero), Enhanced (R1), 6 lahkih destiliranih modelov
Specializacija: Optimizirano za kompleksno reševanje problemov, večjezično razumevanje in ustvarjanje kode za produkcijsko raven

Načrt poti

Nenehne nadgradnje za večmodalno podporo, izboljšanje pogovora in optimizacijo porazdeljenega sklepanja, ki ga poganja sodelovanje odprtokodne skupnosti.

Odprta koda

Prvi na svetu čisti model razmišljanja, ki ga je razvil RL z odprtokodno implementacijo 32B lahka različica doseže matematično zmogljivost na ravni GPT-4 pri 90% nižja cena
Veriga misli vizualizacija zmožnost, ki obravnava izzive "črne skrinjice" umetne inteligence

Kaj je DeepSeek R1 na spletu?

DeepSeek R1 predstavlja prelomen napredek na področju umetne inteligence, ki ponuja najsodobnejšo zmogljivost pri sklepanju, matematiki in nalogah kodiranja. Ta inovativni model prikazuje zmogljivosti, primerljive z vodilnimi lastniškimi rešitvami, hkrati pa ohranja popolno odprtokodno dostopnost.

Tehnična arhitektura in zmogljivosti

Modelna arhitektura

DeepSeek R1 uporablja sofisticirano arhitekturo MoE (mešanica strokovnjakov) z:

  • 37B aktivirani parametri
  • 671B skupni parametri
  • Podpora za dolžino konteksta 128K

Ogrodje DeepSeek R1 vključuje napredne tehnike učenja krepitve in postavlja nova merila v zmožnostih sklepanja AI.

Merila uspešnosti

DeepSeek R1 je dosegel izjemne rezultate v različnih merilih:

  • MATH-500: 97,3% natančnost
  • AIME 2024: stopnja prehoda 79,8%
  • Codeforces: 96.3% percentil razvrstitev

Ti rezultati položaj DeepSeek R1 med najbolj zmogljivimi modeli AI na svetu.

Različice modelov in destilacija Deepseeka na spletu

Razpoložljive različice

DeepSeek R1 je na voljo v več različicah:

  • DeepSeek R1-Zero: Osnovni model
  • DeepSeek R1: Izboljšana različica
  • Več destiliranih različic s parametri od 1,5B do 70B

Optimizacija zmogljivosti

Model dokazuje izjemne zmogljivosti pri:

Kompleksno reševanje problemov

Matematično sklepanje

Generiranje kode

Razumevanje naravnega jezika

DeepSeek-R1-Destill Models (prenos iz spleta)

ModelOsnovni modelPrenos
DeepSeek-R1-Destill-Qwen-1.5BQwen2.5-Math-1.5B🤗 HuggingFace
DeepSeek-R1-Destill-Qwen-7BQwen2.5-Math-7B🤗 HuggingFace
DeepSeek-R1-Destill-Llama-8BLama-3.1-8B🤗 HuggingFace
DeepSeek-R1-Destill-Qwen-14BQwen2.5-14B🤗 HuggingFace
DeepSeek-R1-Destill-Qwen-32BQwen2.5-32B🤗 HuggingFace
DeepSeek-R1-Destill-Llama-70BLlama-3.3-70B-Instruct🤗 HuggingFace

najdete več informacij o modelih DeepSeek-R1-Distill tukaj

Deepseek R1 online je. Neverjetno!!

R1 uporablja čisto okrepljeno učenje, da se ujema z OpenAI o1 – po 95% nižji ceni. , neverjetno je
Jimmy Smith

Cene Deepseek R1

Podrobnosti o ceni

MODEL(1)DOLŽINA KONTEKSTAMAX ŽETON ZA POSTELJICO(2)NAJVEČJI IZHOD ŽETONOV(3)1M ŽETONOV
VHODNA CENA
(ZADETEK V PREDPOMNITELJU) (4)
1M ŽETONOV
VHODNA CENA
(ZGREBA ZAKLJUČKA)
1M ŽETONOV
IZHODNA CENA
deepseek-klepet64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-razlog64K32K8K$0.14$0.55$2.19 (6)

Primerjava cen: DeepSeek R1 proti OpenAI o1

1. Cena DeepSeek R1

DeepSeek R1 ponuja zelo konkurenčno cenovno strukturo, zaradi česar je bistveno bolj dostopen kot OpenAI o1:

  • Vhodni žetoni (zadetek predpomnilnika): $0,14 na milijon žetonov
  • Vhodni žetoni (Cache Miss): $0,55 na milijon žetonov
  • Izhodni žetoni: $2,19 na milijon žetonov

Inteligentni sistem predpomnjenja zmanjša stroške ponavljajočih se poizvedb, saj zagotavlja do 90% prihranki za zadetke v predpomnilniku25.

2. Cene OpenAI o1

V nasprotju s tem je OpenAI o1 precej dražji:

  • Vhodni žetoni: $15 na milijon žetonov
  • Izhodni žetoni: $60 na milijon žetonov

Zaradi tega je OpenAI o1 90-95% dražji kot DeepSeek R1 za enakovredno uporabo112.

3. Stroškovna učinkovitost

Cena DeepSeek R1 je 90-95% nižje kot OpenAI o1, ki ponuja stroškovno učinkovito alternativo brez ogrožanja zmogljivosti. Na primer:

  • 1 milijon vhodnih žetonov:
    • DeepSeek R1: 0,14 (cachehit) ali 0,14 (cacheživjot)oz0,55 (zgrešen predpomnilnik)
    • OpenAI o1: $15
  • 1 milijon izhodnih žetonov:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Zaradi te cenovne dostopnosti je DeepSeek R1 privlačna izbira za razvijalce in podjetja1512.

4. Dodatne ugodnosti

  • Odprtokodni dostop: DeepSeek R1 je na voljo pod licenco MIT, ki omogoča brezplačno uporabo, spreminjanje in komercializacijo512.
  • API prilagodljivost: API DeepSeek R1 podpira napredne funkcije, kot je sklepanje po verigi misli in obravnavanje dolgega konteksta (do 128K žetonov)212.

Blogi in novice o Deepseek R1 in Deepseek na spletu

  • DeepSeek je izdal svojo izvorno kodo, podrobno razlago FlashMLA

  • Kaj je FlashMLA? Obsežen vodnik o njegovem vplivu na jedra za dekodiranje AI

  • Qwen2.5-max proti DeepSeek R1: Poglobljena primerjava modelov: popolna analiza aplikacijskih scenarijev

  • Je blizu DeepSeek-R1-32B in zdrobi s1 Fei-Fei Li! UC Berkeley in drugi odprtokodni novi modeli sklepanja SOTA

Izberite drug jezik o deepseek R1

Pogosto zastavljena vprašanja o deepseek-r1

1,Zakaj je arhitektura DeepSeek-R1 edinstvena?

  • DeepSeek R1 uporablja a sistem MO s 37B aktivnih/671B skupnih parametrov in 128K kontekstno podporo, optimizirano s čistim učenjem okrepitve brez nadzorovanega natančnega prilagajanja.

2. Kakšna je cena DeepSeek R1 v primerjavi z OpenAI o1?

  • DeepSeek R1 stroški 90-95% manj: 0,14/millioninputtokensvsOpenAIo1′s0,14/millioninstruttokensvsOpenAjazo1′s15, z enakovrednimi sposobnostmi sklepanja.

3. Ali lahko DeepSeek R1 namestim lokalno?

  • Da, DeepSeek R1 podpira lokalno uvajanje prek vLLM/SGLang in ponuja 6 ločenih modelov (parametri 1,5B–70B) za okolja z omejenimi viri.

4. Katera merila uspešnosti dokazujejo zmogljivost DeepSeek R1?

  • Doseže SOTA v MATH-500 (97,3%), Codeforces (96,3% percentil) in AIME 2024 (79,8%), kar je boljše od večine komercialnih modelov.

5. Je DeepSeek R1 odprtokoden?

  • Da, DeepSeek R1 ima licenco MIT s polnimi utežmi, ki so na voljo GitHub, ki omogoča komercialno uporabo in spreminjanje.

6. Katere kognitivne sposobnosti odlikujejo DeepSeek R1?

  • Lastnosti samopreverjanje in večstopenjska refleksija, reševanje zapletenih problemov z vidnim sklepanjem v verigi misli.

7. Katere industrije imajo največ koristi od DeepSeek R1?

  • Idealno za raziskave umetne inteligence, ustvarjanje poslovne kode, matematično modeliranje in večjezične aplikacije NLP, ki zahtevajo napredno sklepanje.

8. Kako DeepSeek R1 obravnava integracijo API-ja?

  • Ponuja končne točke API, združljive z OpenAI, s podporo za kontekst 128K in inteligentnim predpomnjenjem ($0,14/milijon žetonov za zadetke predpomnilnika).

9. Katere varnostne ukrepe izvaja DeepSeek R1?

  • Vgrajeni nadzor ponavljanja (temperatura 0,5–0,7) in mehanizmi za poravnavo preprečujejo neskončne zanke, ki so običajne pri modelih, usposobljenih za RL.

10. Kje najdem tehnično dokumentacijo za DeepSeek R1?

Dostopajte do vseh specifikacij prek DeepSeek R1 tehnični dokument in API dokumenti.