DeepSeek R1 internete (nemokamai|nologin)
Revoliucinis atvirojo kodo AI modelis, skirtas pažangiam samprotavimui, pranokstantis "Openai o1

DeepSeek R1 Kalbėkis internetu nemokamai
DeepSeek R1 WEBGPU internete
Naujos kartos samprotavimo modelis, veikiantis naršyklėje su WebGPU pagreitinimu.
Jūs ketinate įkelti DeepSeek-R1-Distill-Qwen-1.5B, 1,5B parametrų pagrindimo LLM, optimizuotą naršyklėje atliekamoms išvadoms. Viskas veikia tik jūsų naršyklėje su 🤗 Transformers.js ir ONNX Runtime Web, t. y. į serverį nesiunčiami jokie duomenys. Kartą įkėlus, ją galima naudoti net neprisijungus prie interneto.

AI kodavimo agentas, maitinamas DeepSeek internetu, dabar nemokamai!
Boltnew.ai yra maitinamas deepseek V3 , yra kodo generavimo įrankis, dabar jis yra nemokamas!






Supakuota DeepSeek R1 funkcija internete
Architektūra
Pastatytas ant MoE (ekspertų mišinys) su 37B aktyviaisiais/671B bendraisiais parametrais ir 128K konteksto ilgiu. Įdiegtas pažangus pastiprintas mokymasis, kad būtų galima pasiekti savikontrolės, daugiapakopio atspindėjimo ir su žmogumi suderinto samprotavimo galimybes.
Veikimas
Matematika: 97.3% tikslumas MATH-500
Kodavimas: Pasiekia 96,3% "Codeforces" dalyvių
Bendrasis mąstymas: 79,8% išlaikymo lygis AIME 2024 (SOTA)
Šie rezultatai "DeepSeek R1 tarp geriausiai pasaulyje veikiančių dirbtinio intelekto modelių.
Įdiegimas
API: Su "OpenAI" suderinamas galinis taškas ($0,14/mln. žetonų)
Atviras šaltinis: MIT licencijuoti svoriai, 1.5B-70B distiliuoti variantai komerciniam naudojimui.
Raskite jį "GitHub" saugykla
Ekosistemos modelis
Variantai: Bazinis (R1-Nulis), patobulintas (R1), 6 lengvi distiliuoti modeliai
Specializacija: Optimizuotas sudėtingoms problemoms spręsti, daugiakalbiam supratimui ir gamybinio lygio kodo generavimui.
Kelių žemėlapis
Nuolatiniai daugialypės terpės palaikymo, pokalbių tobulinimo ir paskirstytų išvadų optimizavimo atnaujinimai, kuriuos lemia atvirojo kodo bendruomenės bendradarbiavimas.
Atviras šaltinis
Pirmasis pasaulyje grynas RL sukurtas samprotavimo modelis su atvirojo kodo įgyvendinimu 32B lengvoji versija pasiekia GPT-4 lygio matematinį našumą esant 90% mažesnė kaina
Minties grandinė vizualizacija gebėjimai, sprendžiant AI "juodosios dėžės" iššūkius.

Kas yra DeepSeek R1 internete?
"DeepSeek R1 yra novatoriška dirbtinio intelekto pažanga, nes siūlo pažangiausias samprotavimo, matematikos ir kodavimo užduotis. Šis naujoviškas modelis pasižymi galimybėmis, prilygstančiomis pirmaujantiems patentuotiems sprendimams, ir tuo pat metu yra visiškai atviras.
Techninė architektūra ir pajėgumai
Modelio architektūra
"DeepSeek R1" naudoja sudėtingą MoE (Mixture of Experts) architektūrą su:
- 37B aktyvuoti parametrai
- 671B bendri parametrai
- 128K konteksto ilgio palaikymas
"DeepSeek R1" sistemoje naudojami pažangūs pastiprinto mokymosi metodai, nustatantys naujus dirbtinio intelekto samprotavimo galimybių standartus.
Veiklos lyginamieji standartai
"DeepSeek R1" pasiekė puikių rezultatų įvairiuose lyginamuosiuose testuose:
- MATH-500: 97.3% tikslumas
- AIME 2024: 79,8% išlaikymo procentas
- Codeforces: 96.3% procentilių reitingas
Šie rezultatai "DeepSeek R1 tarp geriausiai pasaulyje veikiančių dirbtinio intelekto modelių.


„Deepseek“ modelių variantai ir distiliavimas internetu
Galimos versijos
"DeepSeek R1" yra kelių variantų:
- "DeepSeek R1-Zero": bazinis modelis
- "DeepSeek R1": Patobulinta versija
- Keletas distiliuotų versijų nuo 1,5B iki 70B parametrų
Veiklos optimizavimas
Modelis pasižymi išskirtiniais gebėjimais:
Sudėtingas problemų sprendimas
Matematinis mąstymas
Kodų generavimas
Natūralios kalbos supratimas
DeepSeek-R1-Distil modeliai (atsisiųsti internetu)
Modelis | Bazinis modelis | Atsisiųsti |
---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Math-1.5B | 🤗 Apkabinti veidą |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B | 🤗 Apkabinti veidą |
DeepSeek-R1-Distill-Llama-8B | Lama-3.1-8B | 🤗 Apkabinti veidą |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B | 🤗 Apkabinti veidą |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B | 🤗 Apkabinti veidą |
"DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct | 🤗 Apkabinti veidą |
galite rasti daugiau informacijos apie DeepSeek-R1-Distill modelius čia
"Deepseek R1" kainodara
Kainodaros detalė,
MODELIS(1) | KONTEKSTO TIESA | MAX COT TOKENTAI(2) | MAKSIMALUS IŠVESTIES ŽETONŲ SKAIČIUS(3) | 1M TOKENŲ ĮVESTIES KAINA (CACHE HIT) (4) | 1M TOKENŲ ĮVESTIES KAINA (CACHE MISS) | 1M TOKENŲ IŠLAIDOS KAINA |
---|---|---|---|---|---|---|
deepseek pokalbis | 64K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-priežastis | 64K | 32K | 8K | $0.14 | $0.55 | $2.19 (6) |
Kainų palyginimas: "DeepSeek R1" ir "OpenAI o1
1. "DeepSeek R1" kainodara
"DeepSeek R1" siūlo labai konkurencingą kainų struktūrą, todėl ji yra gerokai prieinamesnė nei "OpenAI o1":
- Įvesties žetonai (spartinančiosios atminties pataikymas): $0,14 už milijoną žetonų
- Įvesties žetonai (praleistas talpyklos laikas): $0,55 už milijoną žetonų
- Išvesties ženklai: $2.19 už milijoną žetonų
Išmanioji spartinančiosios atminties sistema sumažina pakartotinių užklausų sąnaudas ir suteikia iki 90% taupymas talpyklos pataikymų25.
2. "OpenAI o1" kainodara
Tuo tarpu "OpenAI o1" yra gerokai brangesnė:
- Įvesties ženklai: $15 už milijoną žetonų
- Išvesties ženklai: $60 už milijoną žetonų
Dėl to "OpenAI o1 90-95% brangesnis nei "DeepSeek R1", kai naudojama lygiaverčiai112.
3. Sąnaudų efektyvumas
"DeepSeek R1" kainodara yra 90-95% apatinė nei "OpenAI o1", todėl tai ekonomiška alternatyva, nesumažinanti našumo. Pavyzdžiui:
- 1 milijonas įvesties žetonų:
- "DeepSeek R1": 0,14(cachehit)arba0,14(cacheSveikit)arba0,55 (talpyklos praleidimas)
- OpenAI o1: $15
- 1 milijonas išvesties žetonų:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Dėl šios prieinamos kainos "DeepSeek R1" yra patrauklus pasirinkimas kūrėjams ir įmonėms1512.
4. Papildomi privalumai
- Atvirojo kodo prieiga: "DeepSeek R1" yra prieinama pagal MIT licenciją, leidžiančią laisvai naudoti, modifikuoti ir komercializuoti512.
- API lankstumas: "DeepSeek R1" API palaiko tokias pažangias funkcijas kaip minčių grandinės samprotavimas ir ilgo konteksto tvarkymas (iki 128 tūkst. žetonų)212.


Tinklaraščiai ir naujienos apie Deepseek R1 ir Deepseek internete
-
DeepSeek išleido savo šaltinio kodą, išsamų FlashMLA paaiškinimą
-
Kas yra FlashMLA? Išsamus vadovas apie jo poveikį AI dekodavimo branduoliams
-
Qwen2.5-max vs DeepSeek R1: išsamus modelių palyginimas: visa taikymo scenarijų analizė
-
Jis yra artimas DeepSeek-R1-32B ir sutraiško Fei-Fei Li s1! UC Berkeley ir kiti atvirojo kodo nauji SOTA išvadų modeliai
Pasirinkite kitą kalbą apie deepseek R1
Dažnai užduodami klausimai apie deepseek-r1
1,Kuo unikali "DeepSeek-R1" architektūra?
- "DeepSeek R1" naudoja VR sistema su 37B aktyviųjų/671B visų parametrų ir 128K konteksto palaikymu, optimizuotas taikant tik pastiprintą mokymąsi be prižiūrimo derinimo.
2. Kaip "DeepSeek R1" kainas galima palyginti su "OpenAI o1"?
- "DeepSeek R1" išlaidos 90-95% mažiau: 0,14/mln. įvesties ženklųvsOpenAIo1′s0,14/millioninputtokensvsOpenAIo1′s15, turinčių lygiaverčius mąstymo gebėjimus.
3. Ar galiu įdiegti "DeepSeek R1" vietoje?
- Taip, "DeepSeek R1" palaiko vietinį diegimą per "vLLM/SGLang" ir siūlo 6 distiliuotus modelius (1,5B-70B parametrų), skirtus ribotų išteklių aplinkai.
4. Kokie lyginamieji rodikliai įrodo "DeepSeek R1" našumą?
- Pasiektas SOTA MATH-500 (97,3%), Codeforces (96,3% procentilis) ir AIME 2024 (79,8%), o tai yra geriau nei dauguma komercinių modelių.
5. Ar "DeepSeek R1" yra atvirojo kodo?
- Taip, "DeepSeek R1" turi MIT licenciją, o visas modelio svoris pateikiamas "GitHub", kuriuo leidžiama naudoti ir keisti komerciniais tikslais.
6. Kokiais pažinimo gebėjimais pasižymi "DeepSeek R1"?
- Funkcijos savikontrolė ir daugiapakopė refleksija, sprendžiant sudėtingas problemas, naudojant matomą minčių grandinę.
7. Kurioms pramonės šakoms "DeepSeek R1" teikia didžiausią naudą?
- Idealiai tinka dirbtinio intelekto tyrimams, įmonių kodų generavimui, matematiniam modeliavimui ir daugiakalbėms NLP programoms, kurioms reikia išplėstinio pagrindimo.
8. Kaip "DeepSeek R1" tvarko API integraciją?
- Siūlo su "OpenAI" suderinamus API galinius taškus su 128K konteksto palaikymu ir išmaniąja spartinančiąja talpykla ($0,14/mln. žetonų pataikymų į talpyklą).
9. Kokias saugos priemones taiko "DeepSeek R1"?
- Įdiegta pasikartojimo kontrolė (temperatūra 0,5-0,7) ir derinimo mechanizmai neleidžia atsirasti begalinėms kilpoms, kurios būdingos RL treniruojamiems modeliams.
10. Kur galima rasti "DeepSeek R1" techninę dokumentaciją?
Gaukite prieigą prie visų specifikacijų "DeepSeek R1" techninis dokumentas ir API dokumentai.