DeepSeek R1 Mkondoni (Bure|Nologi)

Muundo wa AI wa Chanzo Huria cha Mapinduzi kwa Hoja za Kina unaoshinda Openai o1

DeepSeek R1 Chat mtandaoni bila malipo

Bofya ili kuzungumza na Hivi Karibuni Deepseek V3 sasa!

Wakala wa Usimbaji wa AI Inaendeshwa NA DeepSeek mtandaoni Bure Sasa!

Sehemu ya kina inaendeshwa na deepseek V3, ni zana ya kutengeneza msimbo, haina malipo sasa!

DeepSeek R1 WEBGPU Mtandaoni

Muundo wa hoja wa kizazi kijacho unaotumika ndani ya kivinjari chako kwa kuongeza kasi ya WebGPU.

Unakaribia kupakia DeepSeek-R1-Distill-Qwen-1.5B, LLM ya kigezo cha 1.5B iliyoboreshwa kwa makisio ya ndani ya kivinjari. Kila kitu huendeshwa kabisa katika kivinjari chako na 🤗 Transformers.js na ONNX Runtime Web, kumaanisha hakuna data inayotumwa kwa seva. Baada ya kupakiwa, inaweza hata kutumika nje ya mtandao.

Bofya ili kujaribu Deepseek R1 sasa!

Kipengele Kilichojaa DeepSeek R1 mtandaoni

Usanifu

Imejengwa juu MOE (Mchanganyiko wa Wataalamu) yenye jumla ya vigezo vya 37B/671B na urefu wa muktadha wa 128K. Hutekeleza mafunzo ya hali ya juu ya uimarishaji ili kufikia uthibitishaji binafsi, kutafakari kwa hatua nyingi, na uwezo wa kufikiri unaolingana na binadamu.

Utendaji

Hisabati: Usahihi wa 97.3% kwenye MATH-500
Kuweka msimbo: Hufanya vizuri zaidi 96.3% ya washiriki wa Codeforces
Hoja ya Jumla: Kiwango cha kufaulu cha 79.8% kwenye AIME 2024 (SOTA)
Msimamo wa matokeo haya DeepSeek R1 kati ya mifano ya AI inayofanya kazi zaidi ulimwenguni.

Usambazaji

API: Pointi inayolingana na OpenAI (tokeni $0.14/milioni)
Chanzo Huria: Vipimo vilivyo na leseni ya MIT, anuwai 1.5B-70B zilizoyeyushwa kwa matumizi ya kibiashara.
Ipate ndani Hifadhi ya GitHub

Mfumo wa ikolojia wa mfano

Lahaja: Msingi (R1-Zero), Imeimarishwa (R1), modeli 6 za uzani mwepesi
Umaalumu: Imeboreshwa kwa utatuzi changamano wa matatizo, uelewaji wa lugha nyingi, na uzalishaji wa msimbo wa daraja la uzalishaji

Ramani ya barabara

Uboreshaji unaoendelea wa usaidizi wa aina nyingi, uboreshaji wa mazungumzo, na uboreshaji wa uelekezaji uliosambazwa, unaoendeshwa na ushirikiano wa jamii wa chanzo huria.

Chanzo Huria

Dunia ya kwanza modeli safi ya hoja iliyoendelezwa na RL na utekelezaji wa chanzo huria toleo la 32B uzani mwepesi hufanikisha utendaji wa hesabu wa kiwango cha GPT-4 katika 90% gharama ya chini
Mlolongo-wa-Mawazo taswira uwezo, kushughulikia changamoto za AI "sanduku nyeusi".

DeepSeek R1 mtandaoni ni nini?

DeepSeek R1 inawakilisha maendeleo makubwa katika akili bandia, inayotoa utendaji wa hali ya juu katika hoja, hisabati, na kazi za usimbaji. Muundo huu wa kibunifu unaonyesha uwezo unaolingana na suluhu za umiliki zinazoongoza huku ukidumisha ufikiaji kamili wa chanzo huria.

Usanifu wa Kiufundi na Uwezo

Usanifu wa Mfano

DeepSeek R1 hutumia usanifu wa kisasa wa MoE (Mchanganyiko wa Wataalamu) na:

37B vigezo vilivyoamilishwa
671B jumla ya vigezo
Usaidizi wa urefu wa muktadha wa 128K

Mfumo wa DeepSeek R1 unajumuisha mbinu za uimarishaji wa hali ya juu, kuweka vigezo vipya katika uwezo wa hoja wa AI.

Vigezo vya Utendaji

DeepSeek R1 imepata matokeo ya ajabu katika vigezo mbalimbali:

MATH-500: usahihi wa 97.3%
AIME 2024: Kiwango cha kufaulu cha 79.8%
Codeforces: nafasi ya asilimia 96.3%

Msimamo wa matokeo haya DeepSeek R1 kati ya mifano ya AI inayofanya kazi zaidi ulimwenguni.

Mfano lahaja na kunereka kwa Deepseek mtandaoni

Matoleo Yanayopatikana

DeepSeek R1 inakuja katika anuwai nyingi:

DeepSeek R1-Zero: Muundo wa msingi
DeepSeek R1: Toleo lililoboreshwa
Matoleo mengi ya distilled kuanzia 1.5B hadi 70B vigezo

Uboreshaji wa Utendaji

Mfano unaonyesha uwezo wa kipekee katika:

Utatuzi tata wa shida

Hoja ya hisabati

Uzalishaji wa kanuni

Uelewa wa lugha ya asili

Miundo ya DeepSeek-R1-Distill (pakua mtandaoni)

Mfano	Mfano wa Msingi	Pakua
DeepSeek-R1-Distill-Qwen-1.5B	Qwen2.5-Math-1.5B	🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-7B	Qwen2.5-Math-7B	🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Llama-8B	Llama-3.1-8B	🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-14B	Qwen2.5-14B	🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Qwen-32B	Qwen2.5-32B	🤗 Uso wa Kukumbatiana
DeepSeek-R1-Distill-Llama-70B	Llama-3.3-70B-Agiza	🤗 Uso wa Kukumbatiana

unaweza kupata maelezo zaidi kuhusu DeepSeek-R1-Distill Models hapa

Deepseek R1 mtandaoni ni. Ajabu!!

R1 hutumia ujifunzaji kamili wa uimarishaji ili kulinganisha OpenAI o1 - kwa gharama ya 95% kidogo. , ya kushangaza

Jimmy Smith

Bei ya Deepseek R1

Maelezo ya bei.

MFANO⁽¹⁾	UREFU WA MUHTASARI	MAX COT TOKENS⁽²⁾	TOKENI MAX ZA KUTOA⁽³⁾	TOKENI 1M BEI YA KUINGIA (CACHE HIT) ⁽⁴⁾	TOKENI 1M BEI YA KUINGIA (CACHE MISS)	TOKENI 1M BEI YA PATO
deepseek-soga	64K	–	8K	~~$0.07~~⁽⁵⁾ $0.014	~~$0.27~~⁽⁵⁾ $0.14	~~$1.10~~⁽⁵⁾ $0.28
deepseek-sababu	64K	32K	8K	$0.14	$0.55	$2.19 ⁽⁶⁾

Ulinganisho wa Bei: DeepSeek R1 dhidi ya OpenAI o1

1. Bei ya DeepSeek R1

DeepSeek R1 inatoa muundo wa bei wenye ushindani mkubwa, na kuifanya iwe nafuu zaidi kuliko OpenAI o1:

Tokeni za Kuingiza (Hit Cache): $0.14 kwa tokeni milioni
Tokeni za Kuingiza (Cache Miss): $0.55 kwa tokeni milioni
Tokeni za Pato: $2.19 kwa kila tokeni milioni

Mfumo wa uhifadhi wa akili hupunguza gharama kwa maswali yanayorudiwa, kutoa hadi Akiba ya 90% kwa akiba hits25.

2. Bei ya OpenAI o1

Kinyume chake, OpenAI o1 ni ghali zaidi:

Ishara za Kuingiza: $15 kwa tokeni milioni
Tokeni za Pato: $60 kwa tokeni milioni

Hii inafanya OpenAI o1 90-95% gharama kubwa zaidi kuliko DeepSeek R1 kwa matumizi sawa112.

3. Ufanisi wa Gharama

Bei ya DeepSeek R1 ni 90-95% chini kuliko OpenAI o1, inayotoa mbadala wa gharama nafuu bila kuathiri utendakazi. Kwa mfano:

Tokeni za Kuingiza Milioni 1:
- DeepSeek R1: 0.14(cachehit) au0.14(cachehabarit)au0.55 (hakuna akiba)
- OpenAI o1: $15
Milioni 1 ya Tokeni za Pato:
- DeepSeek R1: $2.19
- OpenAI o1: $60

Uwezo huu wa kumudu unaifanya DeepSeek R1 kuwa chaguo la kuvutia kwa wasanidi programu na makampuni ya biashara1512.

4. Faida za Ziada

Ufikiaji wa Chanzo Huria: DeepSeek R1 inapatikana chini ya leseni ya MIT, ikiruhusu matumizi ya bila malipo, marekebisho, na uuzaji512.
Kubadilika kwa API: API ya DeepSeek R1 inasaidia vipengele vya kina kama vile mawazo ya msururu wa mawazo na utunzaji wa muktadha mrefu (hadi tokeni 128K)212.

Blogu na Habari kuhusu Deepseek R1 na Deepseek mtandaoni

Onyesho la Wanamitindo Wanne Bora! Mapitio Yanaonyesha Jinsi Deepseek R1 Ilivyo na Nguvu

Juni 1, 2025
Sasisho la DeepSeek-R1-0528: Kufikiri kwa Kina, Hoja Imara Zaidi

Mei 29, 2025

DeepSeek imetoa msimbo wake wa chanzo, maelezo ya kina ya FlashMLA

Februari 24, 2025
FlashMLA ni nini? Mwongozo wa Kina wa Athari Zake kwenye Kernels za Usimbaji za AI

Februari 24, 2025

Chagua Lugha nyingine kuhusu deepseek R1

العربية

Български

Čeština

Dansk

Uholanzi (Formeel)

Eesti

Suomi

Kifaransa

Deutsch

Ελληνικά

Magyar

Bahasa Indonesia

Kiitaliano

한국어

Lietuvių kalba

Polski

huko Brazil

Kirumi

Русский

Kihispania

Svenska

Türkçe

Maswali yanayoulizwa mara kwa mara kuhusu deepseek-r1

1,Ni nini hufanya usanifu wa DeepSeek-R1 kuwa wa kipekee?

DeepSeek R1 hutumia a Mfumo wa MOE yenye jumla ya vigezo vya 37B amilifu/671B na usaidizi wa muktadha wa 128K, ulioboreshwa kupitia ujifunzaji wa uimarishaji bila urekebishaji mzuri unaosimamiwa.

2. DeepSeek R1 inalinganishwaje na OpenAI o1 katika bei?

Gharama ya DeepSeek R1 90-95% kidogo: 0.14/millioninputtokensvsOpenAIo1′s0.14/millioninukuttokensvsOpenAIo1′s15, yenye uwezo sawa wa kufikiri.

3. Je, ninaweza kusambaza DeepSeek R1 ndani ya nchi?

Ndiyo, DeepSeek R1 inasaidia uwekaji wa ndani kupitia vLLM/SGLang na inatoa miundo 6 iliyoyeyushwa (vigezo 1.5B-70B) kwa mazingira yenye vikwazo vya rasilimali.

4. Ni vigezo gani vinathibitisha utendakazi wa DeepSeek R1?

Hupata SOTA katika MATH-500 (97.3%), Codeforces (96.3% percentile), na AIME 2024 (79.8%), ikifanya kazi vizuri zaidi miundo mingi ya kibiashara.

5. Je, DeepSeek R1 ni chanzo wazi?

Ndio, DeepSeek R1 ina leseni ya MIT na uzani kamili wa mfano unaopatikana GitHub, kuruhusu matumizi ya kibiashara na marekebisho.

6. Ni uwezo gani wa utambuzi unaotofautisha DeepSeek R1?

Vipengele kujithibitisha na kutafakari kwa hatua nyingi, kutatua matatizo changamano kupitia mawazo yanayoonekana ya msururu wa mawazo.

7. Je, ni sekta gani zinazonufaika zaidi na DeepSeek R1?

Inafaa kwa utafiti wa AI, utengenezaji wa msimbo wa biashara, uundaji wa hesabu, na programu za NLP za lugha nyingi zinazohitaji hoja za hali ya juu.

8. DeepSeek R1 inashughulikiaje ujumuishaji wa API?

Hutoa vidokezo vya API vinavyooana na OpenAI kwa usaidizi wa muktadha wa 128K na uakibishaji mahiri (tokeni $0.14/milioni kwa vibonzo vya akiba).

9. DeepSeek R1 inatekeleza hatua gani za usalama?

Udhibiti wa kurudia uliojengewa ndani (joto 0.5-0.7) na mifumo ya upatanishi huzuia mizunguko isiyoisha ya kawaida katika miundo iliyofunzwa kwa RL.

10. Ninaweza kupata wapi hati za kiufundi za DeepSeek R1?

Fikia vipimo kamili kupitia Karatasi ya Kiufundi ya DeepSeek R1 na Hati za API.

DeepSeek R1 Mkondoni (Bure|Nologi)

Muundo wa AI wa Chanzo Huria cha Mapinduzi kwa Hoja za Kina unaoshinda Openai o1

DeepSeek R1 Chat mtandaoni bila malipo

DeepSeek R1 Chat mtandaoni bila malipo

Wakala wa Usimbaji wa AI Inaendeshwa NA DeepSeek mtandaoni Bure Sasa!

DeepSeek R1 WEBGPU Mtandaoni

Kipengele Kilichojaa DeepSeek R1 mtandaoni

Usanifu

Utendaji

Usambazaji

Mfumo wa ikolojia wa mfano

Ramani ya barabara

Chanzo Huria

DeepSeek R1 mtandaoni ni nini?

Usanifu wa Kiufundi na Uwezo

Vigezo vya Utendaji

Mfano lahaja na kunereka kwa Deepseek mtandaoni

Uboreshaji wa Utendaji

Miundo ya DeepSeek-R1-Distill (pakua mtandaoni)

Deepseek R1 mtandaoni ni. Ajabu!!

Bei ya Deepseek R1

Maelezo ya bei.

Ulinganisho wa Bei: DeepSeek R1 dhidi ya OpenAI o1

1. Bei ya DeepSeek R1

2. Bei ya OpenAI o1

3. Ufanisi wa Gharama

4. Faida za Ziada

Blogu na Habari kuhusu Deepseek R1 na Deepseek mtandaoni

Onyesho la Wanamitindo Wanne Bora! Mapitio Yanaonyesha Jinsi Deepseek R1 Ilivyo na Nguvu

Sasisho la DeepSeek-R1-0528: Kufikiri kwa Kina, Hoja Imara Zaidi

DeepSeek imetoa msimbo wake wa chanzo, maelezo ya kina ya FlashMLA

FlashMLA ni nini? Mwongozo wa Kina wa Athari Zake kwenye Kernels za Usimbaji za AI

Chagua Lugha nyingine kuhusu deepseek R1

Maswali yanayoulizwa mara kwa mara kuhusu deepseek-r1

1,Ni nini hufanya usanifu wa DeepSeek-R1 kuwa wa kipekee?

2. DeepSeek R1 inalinganishwaje na OpenAI o1 katika bei?

3. Je, ninaweza kusambaza DeepSeek R1 ndani ya nchi?

4. Ni vigezo gani vinathibitisha utendakazi wa DeepSeek R1?

5. Je, DeepSeek R1 ni chanzo wazi?

6. Ni uwezo gani wa utambuzi unaotofautisha DeepSeek R1?

7. Je, ni sekta gani zinazonufaika zaidi na DeepSeek R1?

8. DeepSeek R1 inashughulikiaje ujumuishaji wa API?

9. DeepSeek R1 inatekeleza hatua gani za usalama?

10. Ninaweza kupata wapi hati za kiufundi za DeepSeek R1?