DeepSeek R1 Online (ilmainen|nologin)

Vallankumouksellinen avoimen lähdekoodin tekoälymalli kehittyneeseen päättelyyn, joka päihittää Openai o1:n.

DeepSeek R1 Chat verkossa ilmaiseksi

DeepSeek R1 WEBGPU verkossa

AI-koodausagentti Powered by DeepSeek verkossa ilmaiseksi nyt!

Ominaisuudet DeepSeek R1 verkossa

Arkkitehtuuri

Rakennettu MoE (asiantuntijoiden sekoitus) 37B aktiivisia/671B kokonaisparametreja ja 128K kontekstin pituus. Toteuttaa kehittynyttä vahvistusoppimista, jolla saavutetaan itsevarmennus, monivaiheinen pohdinta ja ihmisen kanssa yhteensopivat päättelyominaisuudet.

Suorituskyky

Matematiikka: 97.3% tarkkuus MATH-500:ssa.
Koodaus: Päihittää 96.3% Codeforcesin osallistujista.
Yleinen päättely: 79.8% läpäisyaste AIME 2024 (SOTA):ssä.
Näiden tulosten perusteella DeepSeek R1 maailmanlaajuisesti parhaiten toimivien tekoälymallien joukossa.

Käyttöönotto

API: OpenAI-yhteensopiva päätepiste ($0.14/miljoona kuponkia).
Avoin lähdekoodi: MIT-lisensoidut painot, 1.5B-70B tislattuja muunnelmia kaupalliseen käyttöön.
Etsi se osoitteesta GitHub-repositoriossa

Malliekosysteemi

Vaihtoehdot: Base (R1-Zero), Enhanced (R1), 6 kevyttä tislattua mallia.
Erikoistuminen: Optimoitu monimutkaiseen ongelmanratkaisuun, monikieliseen ymmärtämiseen ja tuotantokelpoisen koodin tuottamiseen.

Tiekartta

Jatkuvat päivitykset multimodaaliseen tukeen, keskustelun tehostamiseen ja hajautetun päättelyn optimointiin avoimen lähdekoodin yhteisön yhteistyön avulla.

Avoin lähdekoodi

Maailman ensimmäinen puhdas RL:n kehittämä päättelymalli avoimen lähdekoodin toteutuksella 32B:n kevyt versio saavuttaa GPT-4-tason matemaattisen suorituskyvyn GPT-4:llä. 90% alhaisemmat kustannukset
Ajatusketju visualisointi valmiudet, tekoälyn "mustan laatikon" haasteisiin vastaaminen

Mikä on DeepSeek R1 verkossa?

DeepSeek R1 on uraauurtava edistysaskel tekoälyn alalla, sillä se tarjoaa huippuluokan suorituskykyä päättelyssä, matematiikassa ja koodaustehtävissä. Tämä innovatiivinen malli tarjoaa johtaviin teollisiin ratkaisuihin verrattavissa olevia ominaisuuksia, mutta on silti täysin avoimen lähdekoodin käytettävissä.

Tekninen arkkitehtuuri ja valmiudet

Malliarkkitehtuuri

DeepSeek R1 käyttää kehittynyttä MoE-arkkitehtuuria (Mixture of Experts), jossa:

  • 37B aktivoidut parametrit
  • 671B parametrit yhteensä
  • 128K kontekstin pituuden tuki

DeepSeek R1 -kehys sisältää kehittyneitä vahvistusoppimistekniikoita, jotka asettavat uusia vertailuarvoja tekoälyn päättelykyvylle.

Suorituskyvyn vertailuarvot

DeepSeek R1 on saavuttanut huomattavia tuloksia eri vertailuarvoissa:

  • MATH-500: 97.3% tarkkuus
  • AIME 2024: 79,8% läpäisyaste.
  • Codeforces: prosenttiluokitus: 96.3% prosenttiluokitus

Näiden tulosten perusteella DeepSeek R1 maailmanlaajuisesti parhaiten toimivien tekoälymallien joukossa.

Deepseekin mallivaihtoehdot ja tislaus verkossa

Saatavilla olevat versiot

DeepSeek R1:stä on useita eri versioita:

  • DeepSeek R1-Zero: perusmalli
  • DeepSeek R1: DeepSekeek: Parannettu versio
  • Useita tislattuja versioita, joiden parametrit vaihtelevat 1,5B:stä 70B:hen.

Suorituskyvyn optimointi

Malli osoittaa poikkeuksellisia kykyjä seuraavilla aloilla:

Monimutkainen ongelmanratkaisu

Matemaattinen päättely

Koodin luominen

Luonnollisen kielen ymmärtäminen

DeepSeek-R1-Distil-mallit (lataa verkosta)

MalliPerusmalliLataa
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Matikka-1.5B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B🤗 HuggingFace
DeepSeek-R1-Distill-Lama-8BLlama-3.1-8B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B🤗 HuggingFace
DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Instruct🤗 HuggingFace

löydät lisätietoja DeepSeek-R1-Distill-malleista. täällä

Deepseek R1 verkossa on. Hämmästyttävä!!

R1 käyttää pelkkää vahvistusoppimista OpenAI o1:n tavoin - 95% pienemmillä kustannuksilla. ,sen hämmästyttävä
Jimmy Smith

Deepseek R1:n hinnoittelu

Hinnoittelutiedot

MALLI(1)KONTEKSTIN PITUUSMAX COT TOKENS(2)MAX OUTPUT TOKENS(3)1M TOKENIA
SYÖTTÖHINTA
(CACHE HIT) (4)
1M TOKENIA
SYÖTTÖHINTA
(CACHE MISS)
1M TOKENIA
TULOSHINTA
deepseek-chat64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-järkeilijä64K32K8K$0.14$0.55$2.19 (6)

Hintavertailu: DeepSeek R1 vs. OpenAI o1

1. DeepSeek R1 Hinnoittelu

DeepSeek R1 tarjoaa erittäin kilpailukykyisen hinnoittelurakenteen, joka tekee siitä huomattavasti edullisemman kuin OpenAI o1:

  • Syöttötunnukset (Cache Hit): $0.14 miljoonaa kuponkia kohden.
  • Syöttötunnukset (välimuistissa): $0.55 miljoonaa kuponkia kohden.
  • Tulosmerkinnät: $2.19 miljoonaa kuponkia kohden.

Älykäs välimuistijärjestelmä vähentää toistuvista kyselyistä aiheutuvia kustannuksia, sillä se tarjoaa jopa 90% säästöt välimuistin osumia varten25.

2. OpenAI o1 Hinnoittelu

Sen sijaan OpenAI o1 on huomattavasti kalliimpi:

  • Syöttötunnukset: $15 miljoonaa polettia kohti.
  • Tulosmerkinnät: $60 miljoonaa polettia kohti.

Tämä tekee OpenAI:sta o1 90-95% kalliimpi kuin DeepSeek R1:n vastaava käyttö112.

3. Kustannustehokkuus

DeepSeek R1:n hinnoittelu on 90-95% alempi kuin OpenAI o1, mikä tarjoaa kustannustehokkaan vaihtoehdon suorituskyvystä tinkimättä. Esim:

  • 1 miljoona syöttömerkkiä:
    • DeepSeek R1: 0.14(cachehit)tai0.14(cacheHeit)tai0,55 (välimuistitiedoston ohitus)
    • OpenAI o1: $15
  • 1 miljoona Output-tunnusta:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Tämä edullisuus tekee DeepSeek R1:stä houkuttelevan valinnan kehittäjille ja yrityksille1512.

4. Lisäedut

  • Avoimen lähdekoodin käyttöoikeus: DeepSeek R1 on saatavilla MIT-lisenssillä, joka sallii vapaan käytön, muokkaamisen ja kaupallistamisen512.
  • API-joustavuus: DeepSeek R1:n sovellusliittymä tukee kehittyneitä ominaisuuksia, kuten ajatusketjujen päättelyä ja pitkien kontekstien käsittelyä (jopa 128K merkkejä)212 .

Blogeja ja uutisia Deepseek R1:stä ja Deepseekistä verkossa

  • DeepSeek on julkaissut lähdekoodinsa, yksityiskohtaisen selvityksen FlashMLA:sta

  • Mikä on FlashMLA? Kattava opas sen vaikutuksesta AI-dekoodausytimiin

  • Qwen2.5-max vs DeepSeek R1: syvällinen mallien vertailu: täydellinen analyysi sovellusskenaarioista

  • Se on lähellä DeepSeek-R1-32B:tä ja murskaa Fei-Fei Li:n s1:n! UC Berkeley ja muut avoimen lähdekoodin uudet SOTA-päätelmämallit

Valitse muu kieli aiheesta deepseek R1

Usein kysytyt kysymykset deepseek-r1:stä

1,Mikä tekee DeepSeek-R1:n arkkitehtuurista ainutlaatuisen?

  • DeepSeek R1 käyttää MoE-järjestelmä jossa on 37B aktiivista/671B kokonaisparametria ja 128K kontekstitukea ja joka on optimoitu pelkällä vahvistusoppimisella ilman valvottua hienosäätöä.

2. Miten DeepSeek R1 vertautuu hinnoittelultaan OpenAI o1:een?

  • DeepSeek R1 kustannukset 90-95% vähemmän: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninputtokensvsOpenAIo1′s15, joilla on vastaavat päättelykyvyt.

3. Voinko ottaa DeepSeek R1:n käyttöön paikallisesti?

  • Kyllä, DeepSeek R1 tukee paikallista käyttöönottoa vLLM/SGLangin kautta ja tarjoaa 6 tislattua mallia (1,5B-70B parametria) resurssirajoitteisia ympäristöjä varten.

4. Mitkä vertailuarvot todistavat DeepSeek R1:n suorituskyvyn?

  • Saavuttaa SOTA-arvon MATH-500- (97,3%), Codeforces- (96,3%-prosenttiosuus) ja AIME 2024 -testeissä (79,8%), mikä on parempi kuin useimmat kaupalliset mallit.

5. Onko DeepSeek R1 avoin lähdekoodi?

  • Kyllä, DeepSeek R1 on MIT-lisensoitu, ja täydelliset mallipainot ovat saatavilla osoitteessa GitHub, joka sallii kaupallisen käytön ja muuttamisen.

6. Mitkä kognitiiviset kyvyt erottavat DeepSeek R1:n?

  • Ominaisuudet omavalvonta ja monivaiheinen pohdinta, monimutkaisten ongelmien ratkaiseminen näkyvän ajatusketjun avulla.

7. Mitkä toimialat hyötyvät eniten DeepSeek R1:stä?

  • Ihanteellinen tekoälytutkimukseen, yrityskoodien tuottamiseen, matemaattiseen mallintamiseen ja monikielisiin NLP-sovelluksiin, jotka vaativat kehittynyttä päättelyä.

8. Miten DeepSeek R1 käsittelee API-integraatiota?

  • Tarjoaa OpenAI-yhteensopivat API-päätepisteet, joissa on 128K-kontekstin tuki ja älykäs välimuistitallennus ($0.14/miljoona tokenia välimuistiin osumista varten).

9. Mitä turvatoimia DeepSeek R1 toteuttaa?

  • Sisäänrakennettu toistonhallinta (lämpötila 0,5-0,7) ja kohdistusmekanismit estävät RL-koulutetuissa malleissa yleiset loputtomat silmukat.

10. Mistä löydän DeepSeek R1:n teknistä dokumentaatiota?

Täydelliset tekniset tiedot DeepSeek R1 Tekninen asiakirja ja API-asiakirjat.