DeepSeek R1 Mkondoni (Bure|Nologi)

Muundo wa AI wa Chanzo Huria cha Mapinduzi kwa Hoja za Kina unaoshinda Openai o1

DeepSeek R1 Chat mtandaoni bila malipo

DeepSeek R1 WEBGPU Mtandaoni

Wakala wa Usimbaji wa AI Inaendeshwa NA DeepSeek mtandaoni Bure Sasa!

Kipengele Kilichojaa DeepSeek R1 mtandaoni

Usanifu

Imejengwa juu MOE (Mchanganyiko wa Wataalamu) yenye jumla ya vigezo vya 37B/671B na urefu wa muktadha wa 128K. Hutekeleza mafunzo ya hali ya juu ya uimarishaji ili kufikia uthibitishaji binafsi, kutafakari kwa hatua nyingi, na uwezo wa kufikiri unaolingana na binadamu.

Utendaji

Hisabati: Usahihi wa 97.3% kwenye MATH-500
Kuweka msimbo: Hufanya vizuri zaidi 96.3% ya washiriki wa Codeforces
Hoja ya Jumla: Kiwango cha kufaulu cha 79.8% kwenye AIME 2024 (SOTA)
Msimamo wa matokeo haya DeepSeek R1 kati ya mifano ya AI inayofanya kazi zaidi ulimwenguni.

Usambazaji

API: Pointi inayolingana na OpenAI (tokeni $0.14/milioni)
Chanzo Huria: Vipimo vilivyo na leseni ya MIT, anuwai 1.5B-70B zilizoyeyushwa kwa matumizi ya kibiashara.
Ipate ndani Hifadhi ya GitHub

Mfumo wa ikolojia wa mfano

Lahaja: Msingi (R1-Zero), Imeimarishwa (R1), modeli 6 za uzani mwepesi
Umaalumu: Imeboreshwa kwa utatuzi changamano wa matatizo, uelewaji wa lugha nyingi, na uzalishaji wa msimbo wa daraja la uzalishaji

Ramani ya barabara

Uboreshaji unaoendelea wa usaidizi wa aina nyingi, uboreshaji wa mazungumzo, na uboreshaji wa uelekezaji uliosambazwa, unaoendeshwa na ushirikiano wa jamii wa chanzo huria.

Chanzo Huria

Dunia ya kwanza modeli safi ya hoja iliyoendelezwa na RL na utekelezaji wa chanzo huria toleo la 32B uzani mwepesi hufanikisha utendaji wa hesabu wa kiwango cha GPT-4 katika 90% gharama ya chini
Mlolongo-wa-Mawazo taswira uwezo, kushughulikia changamoto za AI "sanduku nyeusi".

DeepSeek R1 mtandaoni ni nini?

DeepSeek R1 inawakilisha maendeleo makubwa katika akili bandia, inayotoa utendaji wa hali ya juu katika hoja, hisabati, na kazi za usimbaji. Muundo huu wa kibunifu unaonyesha uwezo unaolingana na suluhu za umiliki zinazoongoza huku ukidumisha ufikiaji kamili wa chanzo huria.

Usanifu wa Kiufundi na Uwezo

Usanifu wa Mfano

DeepSeek R1 hutumia usanifu wa kisasa wa MoE (Mchanganyiko wa Wataalamu) na:

  • 37B vigezo vilivyoamilishwa
  • 671B jumla ya vigezo
  • Usaidizi wa urefu wa muktadha wa 128K

Mfumo wa DeepSeek R1 unajumuisha mbinu za uimarishaji wa hali ya juu, kuweka vigezo vipya katika uwezo wa hoja wa AI.

Vigezo vya Utendaji

DeepSeek R1 imepata matokeo ya ajabu katika vigezo mbalimbali:

  • MATH-500: usahihi wa 97.3%
  • AIME 2024: Kiwango cha kufaulu cha 79.8%
  • Codeforces: nafasi ya asilimia 96.3%

Msimamo wa matokeo haya DeepSeek R1 kati ya mifano ya AI inayofanya kazi zaidi ulimwenguni.

Mfano lahaja na kunereka kwa Deepseek mtandaoni

Matoleo Yanayopatikana

DeepSeek R1 inakuja katika anuwai nyingi:

  • DeepSeek R1-Zero: Muundo wa msingi
  • DeepSeek R1: Toleo lililoboreshwa
  • Matoleo mengi ya distilled kuanzia 1.5B hadi 70B vigezo

Uboreshaji wa Utendaji

Mfano unaonyesha uwezo wa kipekee katika:

Utatuzi tata wa shida

Hoja ya hisabati

Uzalishaji wa kanuni

Uelewa wa lugha ya asili

Miundo ya DeepSeek-R1-Distill (pakua mtandaoni)

MfanoMfano wa MsingiPakua
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-Math-1.5B🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-7BQwen2.5-Math-7B🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Llama-8BLlama-3.1-8B🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Llama-70BLlama-3.3-70B-Agiza🤗 Uso wa Kukumbatiana

unaweza kupata maelezo zaidi kuhusu DeepSeek-R1-Distill Models hapa

Deepseek R1 mtandaoni ni. Ajabu!!

R1 hutumia ujifunzaji kamili wa uimarishaji ili kulinganisha OpenAI o1 - kwa gharama ya 95% kidogo. , ya kushangaza
Jimmy Smith

Bei ya Deepseek R1

Maelezo ya bei.

MFANO(1)UREFU WA MUHTASARIMAX COT TOKENS(2)TOKENI MAX ZA KUTOA(3)TOKENI 1M
BEI YA KUINGIA
(CACHE HIT) (4)
TOKENI 1M
BEI YA KUINGIA
(CACHE MISS)
TOKENI 1M
BEI YA PATO
deepseek-soga64K8K$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-sababu64K32K8K$0.14$0.55$2.19 (6)

Ulinganisho wa Bei: DeepSeek R1 dhidi ya OpenAI o1

1. Bei ya DeepSeek R1

DeepSeek R1 inatoa muundo wa bei wenye ushindani mkubwa, na kuifanya iwe nafuu zaidi kuliko OpenAI o1:

  • Tokeni za Kuingiza (Hit Cache): $0.14 kwa tokeni milioni
  • Tokeni za Kuingiza (Cache Miss): $0.55 kwa tokeni milioni
  • Tokeni za Pato: $2.19 kwa kila tokeni milioni

Mfumo wa uhifadhi wa akili hupunguza gharama kwa maswali yanayorudiwa, kutoa hadi Akiba ya 90% kwa akiba hits25.

2. Bei ya OpenAI o1

Kinyume chake, OpenAI o1 ni ghali zaidi:

  • Ishara za Kuingiza: $15 kwa tokeni milioni
  • Tokeni za Pato: $60 kwa tokeni milioni

Hii inafanya OpenAI o1 90-95% gharama kubwa zaidi kuliko DeepSeek R1 kwa matumizi sawa112.

3. Ufanisi wa Gharama

Bei ya DeepSeek R1 ni 90-95% chini kuliko OpenAI o1, inayotoa mbadala wa gharama nafuu bila kuathiri utendakazi. Kwa mfano:

  • Tokeni za Kuingiza Milioni 1:
    • DeepSeek R1: 0.14(cachehit) au0.14(cachehabarit)au0.55 (hakuna akiba)
    • OpenAI o1: $15
  • Milioni 1 ya Tokeni za Pato:
    • DeepSeek R1: $2.19
    • OpenAI o1: $60

Uwezo huu wa kumudu unaifanya DeepSeek R1 kuwa chaguo la kuvutia kwa wasanidi programu na makampuni ya biashara1512.

4. Faida za Ziada

  • Ufikiaji wa Chanzo Huria: DeepSeek R1 inapatikana chini ya leseni ya MIT, ikiruhusu matumizi ya bila malipo, marekebisho, na uuzaji512.
  • Kubadilika kwa API: API ya DeepSeek R1 inasaidia vipengele vya kina kama vile mawazo ya msururu wa mawazo na utunzaji wa muktadha mrefu (hadi tokeni 128K)212.

Blogu na Habari kuhusu Deepseek R1 na Deepseek mtandaoni

  • DeepSeek imetoa msimbo wake wa chanzo, maelezo ya kina ya FlashMLA

  • FlashMLA ni nini? Mwongozo wa Kina wa Athari Zake kwenye Kernels za Usimbaji za AI

  • Qwen2.5-max vs DeepSeek R1: Ulinganisho wa kina wa mifano: uchambuzi kamili wa hali za matumizi.

  • Iko karibu na DeepSeek-R1-32B na kubomoa s1 ya Fei-Fei Li! UC Berkeley na mifano mingine ya wazi ya vyanzo vipya vya uelekezaji vya SOTA

Chagua Lugha nyingine kuhusu deepseek R1

Maswali yanayoulizwa mara kwa mara kuhusu deepseek-r1

1,Ni nini hufanya usanifu wa DeepSeek-R1 kuwa wa kipekee?

  • DeepSeek R1 hutumia a Mfumo wa MOE yenye jumla ya vigezo vya 37B amilifu/671B na usaidizi wa muktadha wa 128K, ulioboreshwa kupitia ujifunzaji wa uimarishaji bila urekebishaji mzuri unaosimamiwa.

2. DeepSeek R1 inalinganishwaje na OpenAI o1 katika bei?

  • Gharama ya DeepSeek R1 90-95% kidogo: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninukuttokensvsOpenAIo1′s15, yenye uwezo sawa wa kufikiri.

3. Je, ninaweza kusambaza DeepSeek R1 ndani ya nchi?

  • Ndiyo, DeepSeek R1 inasaidia uwekaji wa ndani kupitia vLLM/SGLang na inatoa miundo 6 iliyoyeyushwa (vigezo 1.5B-70B) kwa mazingira yenye vikwazo vya rasilimali.

4. Ni vigezo gani vinathibitisha utendakazi wa DeepSeek R1?

  • Hupata SOTA katika MATH-500 (97.3%), Codeforces (96.3% percentile), na AIME 2024 (79.8%), ikifanya kazi vizuri zaidi miundo mingi ya kibiashara.

5. Je, DeepSeek R1 ni chanzo wazi?

  • Ndio, DeepSeek R1 ina leseni ya MIT na uzani kamili wa mfano unaopatikana GitHub, kuruhusu matumizi ya kibiashara na marekebisho.

6. Ni uwezo gani wa utambuzi unaotofautisha DeepSeek R1?

  • Vipengele kujithibitisha na kutafakari kwa hatua nyingi, kutatua matatizo changamano kupitia mawazo yanayoonekana ya msururu wa mawazo.

7. Je, ni sekta gani zinazonufaika zaidi na DeepSeek R1?

  • Inafaa kwa utafiti wa AI, utengenezaji wa msimbo wa biashara, uundaji wa hesabu, na programu za NLP za lugha nyingi zinazohitaji hoja za hali ya juu.

8. DeepSeek R1 inashughulikiaje ujumuishaji wa API?

  • Hutoa vidokezo vya API vinavyooana na OpenAI kwa usaidizi wa muktadha wa 128K na uakibishaji mahiri (tokeni $0.14/milioni kwa vibonzo vya akiba).

9. DeepSeek R1 inatekeleza hatua gani za usalama?

  • Udhibiti wa kurudia uliojengewa ndani (joto 0.5-0.7) na mifumo ya upatanishi huzuia mizunguko isiyoisha ya kawaida katika miundo iliyofunzwa kwa RL.

10. Ninaweza kupata wapi hati za kiufundi za DeepSeek R1?

Fikia vipimo kamili kupitia Karatasi ya Kiufundi ya DeepSeek R1 na Hati za API.