DeepSeek R1 Online (ilmainen|nologin)
Vallankumouksellinen avoimen lähdekoodin tekoälymalli kehittyneeseen päättelyyn, joka päihittää Openai o1:n.

DeepSeek R1 Chat verkossa ilmaiseksi
DeepSeek R1 WEBGPU verkossa
Seuraavan sukupolven päättelymalli, joka toimii paikallisesti selaimessa WebGPU-kiihdytyksellä.
Olet aikeissa ladata DeepSeek-R1-Distill-Qwen-1.5B, 1.5B-parametrin päättely LLM:n, joka on optimoitu selaimessa tapahtuvaan päättelyyn. Kaikki toimii kokonaan selaimessasi 🤗 Transformers.js:n ja ONNX Runtime Webin avulla, eli mitään tietoja ei lähetetä palvelimelle. Kun se on ladattu, sitä voidaan käyttää jopa offline-tilassa.

AI-koodausagentti Powered by DeepSeek verkossa ilmaiseksi nyt!
Boltnew.ai on powered By deepseek V3 , on koodin luomiseen työkalu, sen ilmaiseksi nyt!






Ominaisuudet DeepSeek R1 verkossa
Arkkitehtuuri
Rakennettu MoE (asiantuntijoiden sekoitus) 37B aktiivisia/671B kokonaisparametreja ja 128K kontekstin pituus. Toteuttaa kehittynyttä vahvistusoppimista, jolla saavutetaan itsevarmennus, monivaiheinen pohdinta ja ihmisen kanssa yhteensopivat päättelyominaisuudet.
Suorituskyky
Matematiikka: 97.3% tarkkuus MATH-500:ssa.
Koodaus: Päihittää 96.3% Codeforcesin osallistujista.
Yleinen päättely: 79.8% läpäisyaste AIME 2024 (SOTA):ssä.
Näiden tulosten perusteella DeepSeek R1 maailmanlaajuisesti parhaiten toimivien tekoälymallien joukossa.
Käyttöönotto
API: OpenAI-yhteensopiva päätepiste ($0.14/miljoona kuponkia).
Avoin lähdekoodi: MIT-lisensoidut painot, 1.5B-70B tislattuja muunnelmia kaupalliseen käyttöön.
Etsi se osoitteesta GitHub-repositoriossa
Malliekosysteemi
Vaihtoehdot: Base (R1-Zero), Enhanced (R1), 6 kevyttä tislattua mallia.
Erikoistuminen: Optimoitu monimutkaiseen ongelmanratkaisuun, monikieliseen ymmärtämiseen ja tuotantokelpoisen koodin tuottamiseen.
Tiekartta
Jatkuvat päivitykset multimodaaliseen tukeen, keskustelun tehostamiseen ja hajautetun päättelyn optimointiin avoimen lähdekoodin yhteisön yhteistyön avulla.
Avoin lähdekoodi
Maailman ensimmäinen puhdas RL:n kehittämä päättelymalli avoimen lähdekoodin toteutuksella 32B:n kevyt versio saavuttaa GPT-4-tason matemaattisen suorituskyvyn GPT-4:llä. 90% alhaisemmat kustannukset
Ajatusketju visualisointi valmiudet, tekoälyn "mustan laatikon" haasteisiin vastaaminen

Mikä on DeepSeek R1 verkossa?
DeepSeek R1 on uraauurtava edistysaskel tekoälyn alalla, sillä se tarjoaa huippuluokan suorituskykyä päättelyssä, matematiikassa ja koodaustehtävissä. Tämä innovatiivinen malli tarjoaa johtaviin teollisiin ratkaisuihin verrattavissa olevia ominaisuuksia, mutta on silti täysin avoimen lähdekoodin käytettävissä.
Tekninen arkkitehtuuri ja valmiudet
Malliarkkitehtuuri
DeepSeek R1 käyttää kehittynyttä MoE-arkkitehtuuria (Mixture of Experts), jossa:
- 37B aktivoidut parametrit
- 671B parametrit yhteensä
- 128K kontekstin pituuden tuki
DeepSeek R1 -kehys sisältää kehittyneitä vahvistusoppimistekniikoita, jotka asettavat uusia vertailuarvoja tekoälyn päättelykyvylle.
Suorituskyvyn vertailuarvot
DeepSeek R1 on saavuttanut huomattavia tuloksia eri vertailuarvoissa:
- MATH-500: 97.3% tarkkuus
- AIME 2024: 79,8% läpäisyaste.
- Codeforces: prosenttiluokitus: 96.3% prosenttiluokitus
Näiden tulosten perusteella DeepSeek R1 maailmanlaajuisesti parhaiten toimivien tekoälymallien joukossa.


Deepseekin mallivaihtoehdot ja tislaus verkossa
Saatavilla olevat versiot
DeepSeek R1:stä on useita eri versioita:
- DeepSeek R1-Zero: perusmalli
- DeepSeek R1: DeepSekeek: Parannettu versio
- Useita tislattuja versioita, joiden parametrit vaihtelevat 1,5B:stä 70B:hen.
Suorituskyvyn optimointi
Malli osoittaa poikkeuksellisia kykyjä seuraavilla aloilla:
Monimutkainen ongelmanratkaisu
Matemaattinen päättely
Koodin luominen
Luonnollisen kielen ymmärtäminen
DeepSeek-R1-Distil-mallit (lataa verkosta)
Malli | Perusmalli | Lataa |
---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Matikka-1.5B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Lama-8B | Llama-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct | 🤗 HuggingFace |
löydät lisätietoja DeepSeek-R1-Distill-malleista. täällä
Deepseek R1:n hinnoittelu
Hinnoittelutiedot
MALLI(1) | KONTEKSTIN PITUUS | MAX COT TOKENS(2) | MAX OUTPUT TOKENS(3) | 1M TOKENIA SYÖTTÖHINTA (CACHE HIT) (4) | 1M TOKENIA SYÖTTÖHINTA (CACHE MISS) | 1M TOKENIA TULOSHINTA |
---|---|---|---|---|---|---|
deepseek-chat | 64K | – | 8K | $0.014 | $0.14 | $0.28 |
deepseek-järkeilijä | 64K | 32K | 8K | $0.14 | $0.55 | $2.19 (6) |
Hintavertailu: DeepSeek R1 vs. OpenAI o1
1. DeepSeek R1 Hinnoittelu
DeepSeek R1 tarjoaa erittäin kilpailukykyisen hinnoittelurakenteen, joka tekee siitä huomattavasti edullisemman kuin OpenAI o1:
- Syöttötunnukset (Cache Hit): $0.14 miljoonaa kuponkia kohden.
- Syöttötunnukset (välimuistissa): $0.55 miljoonaa kuponkia kohden.
- Tulosmerkinnät: $2.19 miljoonaa kuponkia kohden.
Älykäs välimuistijärjestelmä vähentää toistuvista kyselyistä aiheutuvia kustannuksia, sillä se tarjoaa jopa 90% säästöt välimuistin osumia varten25.
2. OpenAI o1 Hinnoittelu
Sen sijaan OpenAI o1 on huomattavasti kalliimpi:
- Syöttötunnukset: $15 miljoonaa polettia kohti.
- Tulosmerkinnät: $60 miljoonaa polettia kohti.
Tämä tekee OpenAI:sta o1 90-95% kalliimpi kuin DeepSeek R1:n vastaava käyttö112.
3. Kustannustehokkuus
DeepSeek R1:n hinnoittelu on 90-95% alempi kuin OpenAI o1, mikä tarjoaa kustannustehokkaan vaihtoehdon suorituskyvystä tinkimättä. Esim:
- 1 miljoona syöttömerkkiä:
- DeepSeek R1: 0.14(cachehit)tai0.14(cacheHeit)tai0,55 (välimuistitiedoston ohitus)
- OpenAI o1: $15
- 1 miljoona Output-tunnusta:
- DeepSeek R1: $2.19
- OpenAI o1: $60
Tämä edullisuus tekee DeepSeek R1:stä houkuttelevan valinnan kehittäjille ja yrityksille1512.
4. Lisäedut
- Avoimen lähdekoodin käyttöoikeus: DeepSeek R1 on saatavilla MIT-lisenssillä, joka sallii vapaan käytön, muokkaamisen ja kaupallistamisen512.
- API-joustavuus: DeepSeek R1:n sovellusliittymä tukee kehittyneitä ominaisuuksia, kuten ajatusketjujen päättelyä ja pitkien kontekstien käsittelyä (jopa 128K merkkejä)212 .


Blogeja ja uutisia Deepseek R1:stä ja Deepseekistä verkossa
-
DeepSeek on julkaissut lähdekoodinsa, yksityiskohtaisen selvityksen FlashMLA:sta
-
Mikä on FlashMLA? Kattava opas sen vaikutuksesta AI-dekoodausytimiin
-
Qwen2.5-max vs DeepSeek R1: syvällinen mallien vertailu: täydellinen analyysi sovellusskenaarioista
-
Se on lähellä DeepSeek-R1-32B:tä ja murskaa Fei-Fei Li:n s1:n! UC Berkeley ja muut avoimen lähdekoodin uudet SOTA-päätelmämallit
1,Mikä tekee DeepSeek-R1:n arkkitehtuurista ainutlaatuisen?
- DeepSeek R1 käyttää MoE-järjestelmä jossa on 37B aktiivista/671B kokonaisparametria ja 128K kontekstitukea ja joka on optimoitu pelkällä vahvistusoppimisella ilman valvottua hienosäätöä.
2. Miten DeepSeek R1 vertautuu hinnoittelultaan OpenAI o1:een?
- DeepSeek R1 kustannukset 90-95% vähemmän: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninputtokensvsOpenAIo1′s15, joilla on vastaavat päättelykyvyt.
3. Voinko ottaa DeepSeek R1:n käyttöön paikallisesti?
- Kyllä, DeepSeek R1 tukee paikallista käyttöönottoa vLLM/SGLangin kautta ja tarjoaa 6 tislattua mallia (1,5B-70B parametria) resurssirajoitteisia ympäristöjä varten.
4. Mitkä vertailuarvot todistavat DeepSeek R1:n suorituskyvyn?
- Saavuttaa SOTA-arvon MATH-500- (97,3%), Codeforces- (96,3%-prosenttiosuus) ja AIME 2024 -testeissä (79,8%), mikä on parempi kuin useimmat kaupalliset mallit.
5. Onko DeepSeek R1 avoin lähdekoodi?
- Kyllä, DeepSeek R1 on MIT-lisensoitu, ja täydelliset mallipainot ovat saatavilla osoitteessa GitHub, joka sallii kaupallisen käytön ja muuttamisen.
6. Mitkä kognitiiviset kyvyt erottavat DeepSeek R1:n?
- Ominaisuudet omavalvonta ja monivaiheinen pohdinta, monimutkaisten ongelmien ratkaiseminen näkyvän ajatusketjun avulla.
7. Mitkä toimialat hyötyvät eniten DeepSeek R1:stä?
- Ihanteellinen tekoälytutkimukseen, yrityskoodien tuottamiseen, matemaattiseen mallintamiseen ja monikielisiin NLP-sovelluksiin, jotka vaativat kehittynyttä päättelyä.
8. Miten DeepSeek R1 käsittelee API-integraatiota?
- Tarjoaa OpenAI-yhteensopivat API-päätepisteet, joissa on 128K-kontekstin tuki ja älykäs välimuistitallennus ($0.14/miljoona tokenia välimuistiin osumista varten).
9. Mitä turvatoimia DeepSeek R1 toteuttaa?
- Sisäänrakennettu toistonhallinta (lämpötila 0,5-0,7) ja kohdistusmekanismit estävät RL-koulutetuissa malleissa yleiset loputtomat silmukat.
10. Mistä löydän DeepSeek R1:n teknistä dokumentaatiota?
Täydelliset tekniset tiedot DeepSeek R1 Tekninen asiakirja ja API-asiakirjat.