DeepSeek R1 internete (nemokamai|nologin)

Revoliucinis atvirojo kodo AI modelis, skirtas pažangiam samprotavimui, pranokstantis "Openai o1

DeepSeek R1 Kalbėkis internetu nemokamai

DeepSeek R1 WEBGPU internete

AI kodavimo agentas, maitinamas DeepSeek internetu, dabar nemokamai!

Supakuota DeepSeek R1 funkcija internete

Architektūra

Pastatytas ant MoE (ekspertų mišinys) su 37B aktyviaisiais/671B bendraisiais parametrais ir 128K konteksto ilgiu. Įdiegtas pažangus pastiprintas mokymasis, kad būtų galima pasiekti savikontrolės, daugiapakopio atspindėjimo ir su žmogumi suderinto samprotavimo galimybes.

Veikimas

Matematika: 97.3% tikslumas MATH-500
Kodavimas: Pasiekia 96,3% "Codeforces" dalyvių
Bendrasis mąstymas: 79,8% išlaikymo lygis AIME 2024 (SOTA)
Šie rezultatai "DeepSeek R1 tarp geriausiai pasaulyje veikiančių dirbtinio intelekto modelių.

Įdiegimas

API: Su "OpenAI" suderinamas galinis taškas ($0,14/mln. žetonų)
Atviras šaltinis: MIT licencijuoti svoriai, 1.5B-70B distiliuoti variantai komerciniam naudojimui.
Raskite jį "GitHub" saugykla

Ekosistemos modelis

Variantai: Bazinis (R1-Nulis), patobulintas (R1), 6 lengvi distiliuoti modeliai
Specializacija: Optimizuotas sudėtingoms problemoms spręsti, daugiakalbiam supratimui ir gamybinio lygio kodo generavimui.

Kelių žemėlapis

Nuolatiniai daugialypės terpės palaikymo, pokalbių tobulinimo ir paskirstytų išvadų optimizavimo atnaujinimai, kuriuos lemia atvirojo kodo bendruomenės bendradarbiavimas.

Atviras šaltinis

Pirmasis pasaulyje grynas RL sukurtas samprotavimo modelis su atvirojo kodo įgyvendinimu 32B lengvoji versija pasiekia GPT-4 lygio matematinį našumą esant 90% mažesnė kaina
Minties grandinė vizualizacija gebėjimai, sprendžiant AI "juodosios dėžės" iššūkius.

Kas yra DeepSeek R1 internete?

"DeepSeek R1 yra novatoriška dirbtinio intelekto pažanga, nes siūlo pažangiausias samprotavimo, matematikos ir kodavimo užduotis. Šis naujoviškas modelis pasižymi galimybėmis, prilygstančiomis pirmaujantiems patentuotiems sprendimams, ir tuo pat metu yra visiškai atviras.

Techninė architektūra ir pajėgumai

Modelio architektūra

"DeepSeek R1" naudoja sudėtingą MoE (Mixture of Experts) architektūrą su:

  • 37B aktyvuoti parametrai
  • 671B bendri parametrai
  • 128K konteksto ilgio palaikymas

"DeepSeek R1" sistemoje naudojami pažangūs pastiprinto mokymosi metodai, nustatantys naujus dirbtinio intelekto samprotavimo galimybių standartus.

Veiklos lyginamieji standartai

"DeepSeek R1" pasiekė puikių rezultatų įvairiuose lyginamuosiuose testuose:

  • MATH-500: 97.3% tikslumas
  • AIME 2024: 79,8% išlaikymo procentas
  • Codeforces: 96.3% procentilių reitingas

Šie rezultatai "DeepSeek R1 tarp geriausiai pasaulyje veikiančių dirbtinio intelekto modelių.

„Deepseek“ modelių variantai ir distiliavimas internetu

Galimos versijos

"DeepSeek R1" yra kelių variantų:

  • "DeepSeek R1-Zero": bazinis modelis
  • "DeepSeek R1": Patobulinta versija
  • Keletas distiliuotų versijų nuo 1,5B iki 70B parametrų

Veiklos optimizavimas

Modelis pasižymi išskirtiniais gebėjimais:

Sudėtingas problemų sprendimas

Matematinis mąstymas

Kodų generavimas

Natūralios kalbos supratimas

DeepSeek-R1-Distil modeliai (atsisiųsti internetu)

ModelisBazinis modelisAtsisiųsti
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B🤗 Apkabinti veidą
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B🤗 Apkabinti veidą
DeepSeek-R1-Distill-Llama-8BLama-3.1-8B🤗 Apkabinti veidą
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B🤗 Apkabinti veidą
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B🤗 Apkabinti veidą
"DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Instruct🤗 Apkabinti veidą

galite rasti daugiau informacijos apie DeepSeek-R1-Distill modelius čia

Deepseek R1 online yra. Nuostabu!!

R1 naudoja gryną pastiprinimo mokymąsi, kad prilygtų "OpenAI" o1 - 95% mažesnėmis sąnaudomis. ,jos nuostabi
Jimmy Smith

"Deepseek R1" kainodara

Kainodaros detalė,

MODELIS(1)KONTEKSTO TIESAMAX COT TOKENTAI(2)MAKSIMALUS IŠVESTIES ŽETONŲ SKAIČIUS(3)1M TOKENŲ
ĮVESTIES KAINA
(CACHE HIT) (4)
1M TOKENŲ
ĮVESTIES KAINA
(CACHE MISS)
1M TOKENŲ
IŠLAIDOS KAINA
deepseek pokalbis64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-priežastis64K32K8K$0.14$0.55$2.19 (6)

Kainų palyginimas: "DeepSeek R1" ir "OpenAI o1

1. "DeepSeek R1" kainodara

"DeepSeek R1" siūlo labai konkurencingą kainų struktūrą, todėl ji yra gerokai prieinamesnė nei "OpenAI o1":

  • Įvesties žetonai (spartinančiosios atminties pataikymas): $0,14 už milijoną žetonų
  • Įvesties žetonai (praleistas talpyklos laikas): $0,55 už milijoną žetonų
  • Išvesties ženklai: $2.19 už milijoną žetonų

Išmanioji spartinančiosios atminties sistema sumažina pakartotinių užklausų sąnaudas ir suteikia iki 90% taupymas talpyklos pataikymų25.

2. "OpenAI o1" kainodara

Tuo tarpu "OpenAI o1" yra gerokai brangesnė:

  • Įvesties ženklai: $15 už milijoną žetonų
  • Išvesties ženklai: $60 už milijoną žetonų

Dėl to "OpenAI o1 90-95% brangesnis nei "DeepSeek R1", kai naudojama lygiaverčiai112.

3. Sąnaudų efektyvumas

"DeepSeek R1" kainodara yra 90-95% apatinė nei "OpenAI o1", todėl tai ekonomiška alternatyva, nesumažinanti našumo. Pavyzdžiui:

  • 1 milijonas įvesties žetonų:
    • "DeepSeek R1": 0,14(cachehit)arba0,14(cacheSveikit)arba0,55 (talpyklos praleidimas)
    • OpenAI o1: $15
  • 1 milijonas išvesties žetonų:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Dėl šios prieinamos kainos "DeepSeek R1" yra patrauklus pasirinkimas kūrėjams ir įmonėms1512.

4. Papildomi privalumai

  • Atvirojo kodo prieiga: "DeepSeek R1" yra prieinama pagal MIT licenciją, leidžiančią laisvai naudoti, modifikuoti ir komercializuoti512.
  • API lankstumas: "DeepSeek R1" API palaiko tokias pažangias funkcijas kaip minčių grandinės samprotavimas ir ilgo konteksto tvarkymas (iki 128 tūkst. žetonų)212.

Tinklaraščiai ir naujienos apie Deepseek R1 ir Deepseek internete

  • DeepSeek išleido savo šaltinio kodą, išsamų FlashMLA paaiškinimą

  • Kas yra FlashMLA? Išsamus vadovas apie jo poveikį AI dekodavimo branduoliams

  • Qwen2.5-max vs DeepSeek R1: išsamus modelių palyginimas: visa taikymo scenarijų analizė

  • Jis yra artimas DeepSeek-R1-32B ir sutraiško Fei-Fei Li s1! UC Berkeley ir kiti atvirojo kodo nauji SOTA išvadų modeliai

Pasirinkite kitą kalbą apie deepseek R1

Dažnai užduodami klausimai apie deepseek-r1

1,Kuo unikali "DeepSeek-R1" architektūra?

  • "DeepSeek R1" naudoja VR sistema su 37B aktyviųjų/671B visų parametrų ir 128K konteksto palaikymu, optimizuotas taikant tik pastiprintą mokymąsi be prižiūrimo derinimo.

2. Kaip "DeepSeek R1" kainas galima palyginti su "OpenAI o1"?

  • "DeepSeek R1" išlaidos 90-95% mažiau: 0,14/mln. įvesties ženklųvsOpenAIo1′s0,14/millioninputtokensvsOpenAIo1′s15, turinčių lygiaverčius mąstymo gebėjimus.

3. Ar galiu įdiegti "DeepSeek R1" vietoje?

  • Taip, "DeepSeek R1" palaiko vietinį diegimą per "vLLM/SGLang" ir siūlo 6 distiliuotus modelius (1,5B-70B parametrų), skirtus ribotų išteklių aplinkai.

4. Kokie lyginamieji rodikliai įrodo "DeepSeek R1" našumą?

  • Pasiektas SOTA MATH-500 (97,3%), Codeforces (96,3% procentilis) ir AIME 2024 (79,8%), o tai yra geriau nei dauguma komercinių modelių.

5. Ar "DeepSeek R1" yra atvirojo kodo?

  • Taip, "DeepSeek R1" turi MIT licenciją, o visas modelio svoris pateikiamas "GitHub", kuriuo leidžiama naudoti ir keisti komerciniais tikslais.

6. Kokiais pažinimo gebėjimais pasižymi "DeepSeek R1"?

  • Funkcijos savikontrolė ir daugiapakopė refleksija, sprendžiant sudėtingas problemas, naudojant matomą minčių grandinę.

7. Kurioms pramonės šakoms "DeepSeek R1" teikia didžiausią naudą?

  • Idealiai tinka dirbtinio intelekto tyrimams, įmonių kodų generavimui, matematiniam modeliavimui ir daugiakalbėms NLP programoms, kurioms reikia išplėstinio pagrindimo.

8. Kaip "DeepSeek R1" tvarko API integraciją?

  • Siūlo su "OpenAI" suderinamus API galinius taškus su 128K konteksto palaikymu ir išmaniąja spartinančiąja talpykla ($0,14/mln. žetonų pataikymų į talpyklą).

9. Kokias saugos priemones taiko "DeepSeek R1"?

  • Įdiegta pasikartojimo kontrolė (temperatūra 0,5-0,7) ir derinimo mechanizmai neleidžia atsirasti begalinėms kilpoms, kurios būdingos RL treniruojamiems modeliams.

10. Kur galima rasti "DeepSeek R1" techninę dokumentaciją?

Gaukite prieigą prie visų specifikacijų "DeepSeek R1" techninis dokumentas ir API dokumentai.