DeepSeek R1 በመስመር ላይ (ነፃ | ኖሎጂን)

Openai o1ን የሚያሸንፍ አብዮታዊ ክፍት-ምንጭ AI ሞዴል ለላቀ ማመዛዘን

DeepSeek R1 በነፃ በመስመር ላይ ይወያዩ

DeepSeek R1 WEBGPU በመስመር ላይ

በ DeepSeek የመስመር ላይ የ AI ኮድ ማድረጊያ ወኪል አሁን በነጻ!

በDeepSeek R1 በመስመር ላይ የታሸገ ባህሪ

አርክቴክቸር

ላይ የተገነባ MOE (የባለሙያዎች ድብልቅ) በ 37B ንቁ/671B ጠቅላላ መለኪያዎች እና 128K የአውድ ርዝመት። ራስን ማረጋገጥ፣ ባለብዙ ደረጃ ነጸብራቅ እና በሰዎች ላይ የተመሰረተ የማመዛዘን ችሎታዎችን ለማግኘት የላቀ የማጠናከሪያ ትምህርትን ተግባራዊ ያደርጋል።

አፈጻጸም

ሒሳብ: 97.3% ትክክለኛነት በ MATH-500
ኮድ መስጠትከ Codeforces ተሳታፊዎች 96.3% ይበልጣል
አጠቃላይ ምክንያትበ AIME 2024 (SOTA) ላይ 79.8% ማለፊያ መጠን
እነዚህ የውጤቶች አቀማመጥ DeepSeek R1 በዓለም አቀፍ ደረጃ ከፍተኛ አፈጻጸም ካላቸው AI ሞዴሎች መካከል።

ማሰማራት

ኤፒአይክፍት AI-ተኳሃኝ የመጨረሻ ነጥብ ($0.14/ሚሊዮን ቶከኖች)
ክፍት ምንጭ: MIT-ፈቃድ ያላቸው ክብደቶች፣ 1.5B-70B distilled ልዩነቶች ለንግድ አገልግሎት።
ውስጥ ያግኙት። GitHub ማከማቻ

ሞዴል ስነ-ምህዳር

ተለዋጮች: ቤዝ (R1-ዜሮ)፣ የተሻሻለ (R1)፣ 6 ቀላል ክብደት ያላቸው የተበታተኑ ሞዴሎች
ስፔሻላይዜሽንለተወሳሰበ ችግር ፈቺ፣ ለብዙ ቋንቋዎች ግንዛቤ እና ለምርት ደረጃ ኮድ ማፍለቅ የተመቻቸ

የመንገድ ካርታ

በክፍት ምንጭ የማህበረሰብ ትብብር የሚመራ የመልቲሞዳል ድጋፍ፣ የውይይት ማሻሻያ እና የተከፋፈለ መረጃ ማመቻቸት ቀጣይነት ያለው ማሻሻያ።

ክፍት ምንጭ

የአለም የመጀመሪያ ንጹህ RL-የዳበረ የማመዛዘን ሞዴል በክፍት ምንጭ ትግበራ 32B ቀላል ክብደት ያለው ስሪት GPT-4-ደረጃ የሂሳብ አፈጻጸምን በ ላይ አሳክቷል። 90% ዝቅተኛ ዋጋ
የአስተሳሰብ ሰንሰለት ምስላዊነት ችሎታ, AI "ጥቁር ሳጥን" ተግዳሮቶችን መፍታት

DeepSeek R1 በመስመር ላይ ምንድነው?

DeepSeek R1 በአርቴፊሻል ኢንተለጀንስ ውስጥ ትልቅ እድገትን ይወክላል፣ በምክንያታዊነት፣ በሂሳብ እና በኮድ ስራዎች ዘመናዊ አፈጻጸም ያቀርባል። ይህ የፈጠራ ሞዴል የተሟላ ክፍት ምንጭ ተደራሽነትን በማስጠበቅ የባለቤትነት መፍትሄዎችን ከመምራት ጋር የሚወዳደር ችሎታዎችን ያሳያል።

ቴክኒካዊ አርክቴክቸር እና ችሎታዎች

ሞዴል አርክቴክቸር

DeepSeek R1 የተራቀቀ MoE (የባለሙያዎች ድብልቅ) አርክቴክቸርን ከሚከተለው ጋር ይጠቀማል።

  • 37B ገቢር መለኪያዎች
  • 671B ጠቅላላ መለኪያዎች
  • 128K የአውድ ርዝመት ድጋፍ

የDeepSeek R1 ማዕቀፍ የላቀ የማጠናከሪያ ትምህርት ቴክኒኮችን ያካትታል፣ በ AI የማመዛዘን ችሎታዎች ላይ አዲስ መመዘኛዎችን ያዘጋጃል።

የአፈጻጸም መለኪያዎች

DeepSeek R1 በተለያዩ መለኪያዎች ላይ አስደናቂ ውጤቶችን አስመዝግቧል።

  • ሒሳብ-500: 97.3% ትክክለኛነት
  • AIME 2024፡ 79.8% የማለፊያ መጠን
  • Codeforces: 96.3% ፐርሰንታይል ደረጃ

እነዚህ የውጤቶች አቀማመጥ DeepSeek R1 በዓለም አቀፍ ደረጃ ከፍተኛ አፈጻጸም ካላቸው AI ሞዴሎች መካከል።

የሞዴል ተለዋጮች እና Deepseek መስመር ላይ Distillation

የሚገኙ ስሪቶች

DeepSeek R1 በበርካታ ተለዋጮች ይመጣል

  • DeepSeek R1-ዜሮ፡ ቤዝ ሞዴል
  • DeepSeek R1: የተሻሻለ ስሪት
  • ከ 1.5B እስከ 70B ግቤቶች ያሉ ብዙ የተበታተኑ ስሪቶች

የአፈጻጸም ማመቻቸት

ሞዴሉ በሚከተሉት ውስጥ ልዩ ችሎታዎችን ያሳያል-

ውስብስብ ችግር መፍታት

ሒሳባዊ አመክንዮ

ኮድ ማመንጨት

የተፈጥሮ ቋንቋ ግንዛቤ

DeepSeek-R1-Distill ሞዴሎች (ኦንላይን አውርድ)

ሞዴልየመሠረት ሞዴልአውርድ
DeepSeek-R1-Distill-Qwen-1.5BQwen2.5-ሒሳብ-1.5ቢ🤗 ማቀፍ ፊት
DeepSeek-R1-Distill-Qwen-7BQwen2.5-ሒሳብ-7ቢ🤗 ማቀፍ ፊት
DeepSeek-R1-Distill-ላማ-8ቢላማ-3.1-8ቢ🤗 ማቀፍ ፊት
DeepSeek-R1-Distill-Qwen-14BQwen2.5-14B🤗 ማቀፍ ፊት
DeepSeek-R1-Distill-Qwen-32BQwen2.5-32B🤗 ማቀፍ ፊት
DeepSeek-R1-Distill-ላማ-70ቢላማ-3.3-70B-መመሪያ🤗 ማቀፍ ፊት

ስለ DeepSeek-R1-Distill ሞዴሎች የበለጠ መረጃ ማግኘት ይችላሉ። እዚህ

Deepseek R1 መስመር ላይ ነው። የሚገርም!!

R1 ከOpenAI o1 ጋር ለማዛመድ ንጹህ የማጠናከሪያ ትምህርት ይጠቀማል - በ95% ያነሰ ዋጋ። ፣ አስደናቂ ነው።
ጂሚ ስሚዝ

የ Deepseek R1 ዋጋ

የዋጋ ዝርዝር.

ሞዴል(1)የአውድ ርዝመትMAX COT TOKENS(2)ከፍተኛ የውጤት ምልክቶች(3)1M TOKENS
የግቤት ዋጋ
(መሸጎጫ ምታ) (4)
1M TOKENS
የግቤት ዋጋ
(መሸጎጫ MISS)
1M TOKENS
የውጤት ዋጋ
deepseek-ቻት64 ኪ8 ኪ$0.07(5)
$0.014
$0.27(5)
$0.14
$1.10(5)
$0.28
deepseek-ምክንያት64 ኪ32 ኪ8 ኪ$0.14$0.55$2.19 (6)

የዋጋ ንጽጽር፡ DeepSeek R1 vs. OpenAI o1

1. DeepSeek R1 ዋጋ

DeepSeek R1 በጣም ተወዳዳሪ የሆነ የዋጋ አወጣጥ መዋቅር ያቀርባል፣ይህም ከOpenAI o1 በእጅጉ የበለጠ ተመጣጣኝ ያደርገዋል፡

  • የግቤት ማስመሰያዎች (መሸጎጫ ምታ): $0.14 በአንድ ሚሊዮን ቶከኖች
  • የግቤት ማስመሰያዎች (መሸጎጫ ሚስ): $0.55 በአንድ ሚሊዮን ቶከኖች
  • የውጤት ማስመሰያዎች: $2.19 በአንድ ሚሊዮን ቶከኖች

የማሰብ ችሎታ ያለው የመሸጎጫ ስርዓት ለተደጋጋሚ ጥያቄዎች ወጪዎችን ይቀንሳል, እስከ ያቀርባል 90% ቁጠባዎች ለመሸጎጫ hits25.

2. ክፍት AI o1 ዋጋ

በተቃራኒው፣ OpenAI o1 በጣም ውድ ነው፡-

  • የግቤት ማስመሰያዎች: $15 በአንድ ሚሊዮን ቶከኖች
  • የውጤት ማስመሰያዎች: $60 በአንድ ሚሊዮን ቶከኖች

ይህ OpenAI o1 ያደርገዋል 90-95% የበለጠ ውድ ከDeepSeek R1 በላይ ለተመጣጣኝ አጠቃቀም112።

3. ወጪ ቅልጥፍና

የDeepSeek R1 ዋጋ ነው። 90-95% ዝቅተኛ ከOpenAI o1 ይልቅ፣ አፈጻጸምን ሳይጎዳ ወጪ ቆጣቢ አማራጭ በማቅረብ። ለምሳሌ፡-

  • 1 ሚሊዮን የግቤት ቶከኖች:
    • DeepSeek R1፡ 0.14(cachehit) or0.14(ሃይ)ወይም0.55 (መሸጎጫ ማጣት)
    • ክፍትAI o1፡ $15
  • 1 ሚሊዮን የውጤት ምልክቶች:
    • DeepSeek R1፡ $2.19
    • ክፍት AI o1፡ $60

ይህ ተመጣጣኝነት DeepSeek R1 ለገንቢዎች እና ለኢንተርፕራይዞች ማራኪ ምርጫ ያደርገዋል1512.

4. ተጨማሪ ጥቅሞች

  • ክፍት ምንጭ መዳረሻ: DeepSeek R1 በነጻ መጠቀም፣ ማሻሻያ እና የንግድ ስራ512 በመፍቀድ በMIT ፈቃድ ይገኛል።
  • የኤፒአይ ተለዋዋጭነት: DeepSeek R1's API የላቁ ባህሪያትን ይደግፋል የአስተሳሰብ ሰንሰለት እና የረጅም አውድ አያያዝ (እስከ 128 ኪ ቶከን)212።

ብሎጎች እና ዜና ስለ Deepseek R1 እና Deepseek በመስመር ላይ

  • DeepSeek የምንጭ ኮዱን አውጥቷል፣ የFlashMLA ዝርዝር ማብራሪያ

  • FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

  • Qwen2.5-max vs DeepSeek R1፡ የሞዴሎች ጥልቅ ንጽጽር፡ የመተግበሪያ ሁኔታዎች ሙሉ ትንታኔ

  • ወደ DeepSeek-R1-32B ቅርብ ነው እና Fei-Fei Li's s1ን ያደቃል! ዩሲ በርክሌይ እና ሌሎች ክፍት ምንጭ አዲስ የ SOTA አመላካች ሞዴሎች

ስለ deepseek R1 ሌላ ቋንቋ ይምረጡ

ስለ deepseek-r1 ተደጋግሞ የሚጠየቁ ጥያቄዎች

1,የDeepSeek-R1 አርክቴክቸር ልዩ የሚያደርገው ምንድን ነው?

  • DeepSeek R1 ኤ ይጠቀማል MOE ስርዓት በ37B ንቁ/671B ጠቅላላ መለኪያዎች እና 128K አውድ ድጋፍ፣ ያለ ክትትል ጥሩ ማስተካከያ በንጹህ የማጠናከሪያ ትምህርት የተሻሻለ።

2. DeepSeek R1 ከOpenAI o1 ጋር በዋጋ እንዴት ይነጻጸራል?

  • DeepSeek R1 ወጪዎች 90-95% ያነሰ: 0.14/millioninputtokensvsOpenAIo1′s0.14/ኤልእኔኒንገጽTTnኤስኤስኦፕnአይ1"ኤስ15, በተመጣጣኝ የማመዛዘን ችሎታዎች.

3. DeepSeek R1 በአገር ውስጥ ማሰማራት እችላለሁ?

  • አዎ፣ DeepSeek R1 በvLLM/SGLang በኩል የአካባቢ ማሰማራትን ይደግፋል እና በንብረት ለተገደቡ አካባቢዎች 6 የተዘበራረቁ ሞዴሎችን (1.5B-70B መለኪያዎች) ያቀርባል።

4. የDeepSeek R1 አፈጻጸምን የሚያረጋግጡ ምን መለኪያዎች ናቸው?

  • SOTA በ MATH-500 (97.3%)፣ Codeforces (96.3% ፐርሰንታይል) እና AIME 2024 (79.8%)፣ ከአብዛኞቹ የንግድ ሞዴሎች ይበልጣል።

5. DeepSeek R1 ክፍት ምንጭ ነው?

  • አዎ፣ DeepSeek R1 ሙሉ የሞዴል ክብደቶች ያሉት MIT ፈቃድ አለው። GitHub, የንግድ አጠቃቀም እና ማሻሻያ መፍቀድ.

6. DeepSeek R1 ምን ዓይነት የግንዛቤ ችሎታዎች ይለያሉ?

  • ባህሪያት ራስን ማረጋገጥ እና ባለብዙ ደረጃ ነጸብራቅ, ውስብስብ ችግሮችን በሚታዩ የአስተሳሰብ ሰንሰለት መፍታት.

7. ከDeepSeek R1 የበለጠ የሚጠቀሙት የትኞቹ ኢንዱስትሪዎች ናቸው?

  • የላቀ ምክንያትን ለሚፈልጉ ለ AI ምርምር፣ ለድርጅት ኮድ ማመንጨት፣ ለሒሳብ ሞዴሊንግ እና ለብዙ ቋንቋ ተናጋሪ NLP መተግበሪያዎች ተስማሚ።

8. DeepSeek R1 የኤፒአይ ውህደትን እንዴት ይቆጣጠራል?

  • ከ128K አውድ ድጋፍ እና ብልህ መሸጎጫ ($0.14/ሚሊየን ቶከኖች ለመሸጎጫ ስኬቶች) ከOpenAI-ተኳሃኝ የኤፒአይ መጨረሻ ነጥቦችን ያቀርባል።

9. DeepSeek R1 ምን ዓይነት የደህንነት እርምጃዎችን ይጠቀማል?

  • አብሮገነብ የድግግሞሽ ቁጥጥር (የሙቀት መጠን 0.5-0.7) እና የአሰላለፍ ዘዴዎች በ RL በሰለጠኑ ሞዴሎች ውስጥ ማለቂያ የሌላቸውን ቀለበቶች ይከላከላሉ ።

10. ለ DeepSeek R1 ቴክኒካዊ ሰነዶችን የት ማግኘት እችላለሁ?

ሙሉ ዝርዝሮችን በ በኩል ይድረሱ DeepSeek R1 የቴክኒክ ወረቀት እና ኤፒአይ ሰነዶች.