DeepSeek የምንጭ ኮዱን አውጥቷል፣ የFlashMLA ዝርዝር ማብራሪያ

DeepSeek የምንጭ ኮዱን አውጥቷል፣ የFlashMLA ዝርዝር ማብራሪያ

ባለፈው ሳምንት DeepSeek በሚቀጥለው ሳምንት አምስት ፕሮጀክቶችን እንደሚከፍት አስታውቋል፡ Netizens “በዚህ ጊዜ OpenAI በእርግጥ እዚህ አለ። ልክ አሁን፣ የመጀመሪያው ክፍት ምንጭ ፕሮጀክት መጣ፣ ከግንዛቤ ማጣደፍ፣ FlashMLA፡ ክፍት ምንጭ ፕሮጀክት አድራሻ፡ DeepSeek FlashMLA ለሁለት ሰዓታት ክፍት ምንጭ ሆኖ ቆይቷል፣ እና Github አስቀድሞ 2.7k+ ኮከቦች አሉት፡ The…

FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

FlashMLA በአርቴፊሻል ኢንተለጀንስ አለም በተለይም በትልልቅ ቋንቋ ሞዴሎች (LLMs) መስክ በፍጥነት ትኩረትን አግኝቷል። በDeepSeek የተገነባው ይህ ፈጠራ መሳሪያ ለሆፐር ጂፒዩዎች-ከፍተኛ አፈጻጸም ያላቸው ቺፕስ በተለምዶ በ AI ስሌት ውስጥ እንደ ተመቻቸ ዲኮዲንግ ከርነል ሆኖ ያገለግላል። FlashMLA በተለዋዋጭ-ርዝመት ቅደም ተከተሎች ቀልጣፋ ሂደት ላይ ያተኩራል፣ይህም በተለይ በጥሩ ሁኔታ ተስማሚ ያደርገዋል…

Qwen2.5-max vs DeepSeek R1፡ የሞዴሎች ጥልቅ ንጽጽር፡ የመተግበሪያ ሁኔታዎች ሙሉ ትንታኔ

Qwen2.5-max vs DeepSeek R1፡ የሞዴሎች ጥልቅ ንጽጽር፡ የመተግበሪያ ሁኔታዎች ሙሉ ትንታኔ

መግቢያ ዛሬ፣ ትልቅ የቋንቋ ሞዴሎች (LLMs) ወሳኝ ሚና ይጫወታሉ። እ.ኤ.አ. በ 2025 መጀመሪያ ላይ የ AI ፉክክር እየተጠናከረ ሲሄድ አሊባባ አዲሱን Qwen2.5-max AI ሞዴል ፈጠረ ፣ እና DeepSeek የተሰኘው ከቻይና ሃንግዙ ኩባንያ የኤል ኤም ኤል ቴክኖሎጂ ቁንጮ የሆነውን R1 ሞዴልን አስተዋወቀ። Deepseek R1 ስቧል ክፍት ምንጭ AI ሞዴል ነው…

ወደ DeepSeek-R1-32B ቅርብ ነው እና Fei-Fei Li's s1ን ያደቃል! ዩሲ በርክሌይ እና ሌሎች ክፍት ምንጭ አዲስ የ SOTA አመላካች ሞዴሎች

የ32ቢ ኢንፈረንስ ሞዴል ከመረጃው 1/8 ብቻ ይጠቀማል እና ከDeepSeek-R1 ተመሳሳይ መጠን ጋር የተሳሰረ ነው! ልክ አሁን፣ እንደ ስታንፎርድ፣ ዩሲ በርክሌይ፣ እና የዋሽንግተን ዩኒቨርሲቲ ያሉ ተቋማት በጋራ SOTA-ደረጃ ኢንፈረንስ ሞዴልን OpenThinker-32B አውጥተዋል እንዲሁም እስከ 114k የስልጠና መረጃዎችን ከፍተዋል። የክፍት ቲንክከር ፕሮጄክት መነሻ ገፅ፡ OpenThinker ማቀፍ ፊት፡…

ትልቅ የቋንቋ ሞዴል አስተዳደር ቅርሶች እንደ DeepSeek፡ Cherry Studio፣ Chatbox፣ AnythingLLM፣ የእርስዎ ቅልጥፍና አፋጣኝ ማነው?

ትልቅ የቋንቋ ሞዴል አስተዳደር ቅርሶች እንደ DeepSeek፡ Cherry Studio፣ Chatbox፣ AnythingLLM፣ የእርስዎ ቅልጥፍና አፋጣኝ ማነው?

ብዙ ሰዎች ቻትቦክስን እንደ ምስላዊ መሳሪያ በመጠቀም Deepseek Large Language Models በአካባቢው ማሰማራት እና መጠቀም ጀምረዋል። በ2025፣…

Le Chat ከመቶ ቢሊዮን ዶላር ኢንቨስትመንት ጋር በገበታው ላይ ቀዳሚ ነው። ከአሜሪካ እና ከቻይና በኋላ ሶስተኛው AI ሃይል ነው?

እ.ኤ.አ. የካቲት 9 የፈረንሳዩ ፕሬዝዳንት ኢማኑኤል ማክሮን በሚቀጥሉት ጥቂት ዓመታት ፈረንሳይ 109 ቢሊዮን ዩሮ (113 ቢሊዮን ዶላር) በ AI መስክ እንደምታፈስ አስታውቀዋል። ይህ ኢንቨስትመንት በፈረንሳይ የ AI ፓርክ ለመገንባት፣ መሠረተ ልማቱን ለማሻሻል እና በአካባቢው AI ጅምር ላይ ኢንቨስት ለማድረግ ይጠቅማል። ይህ በእንዲህ እንዳለ፣ የፈረንሳይ ጀማሪ ሚስትራል፣…

Deepseek ምን ሊያሳካ ይችላል? OpenAI እንኳን ማድረግ አይችልም?

የDeepSeek እውነተኛ ዋጋ ተገምቷል! DeepSeek-R1 ያለምንም ጥርጥር አዲስ የጋለ ስሜት ወደ ገበያው አምጥቷል። አግባብነት ያለው ተጠቃሚ የሚባሉት ኢላማዎች በከፍተኛ ሁኔታ እያደጉ መምጣታቸው ብቻ ሳይሆን አንዳንድ ሰዎች ከDeepSeek ጋር የተያያዙ ኮርሶችን እና ሶፍትዌሮችን በማዘጋጀት ገንዘብ ለማግኘት በመሞከር ላይ ይገኛሉ። ምንም እንኳን እነዚህ ክስተቶች የ…

የአለም ዋናዎቹ የኤአይአይ ምርቶች በመተንተን እና አጠቃላይ የተጠቃሚ ልምድ መመሪያዎች (DeepSeek እና GPTን ጨምሮ) ላይ ያተኩራሉ

የአለም ዋናዎቹ የኤአይአይ ምርቶች በመተንተን እና አጠቃላይ የተጠቃሚ ልምድ መመሪያዎች (DeepSeek እና GPTን ጨምሮ) ላይ ያተኩራሉ

የተግባር አቀማመጥ እና የዋና ጥቅማ ጥቅም ትንተና ChatGPT (OpenAI) - ለሁሉም-ዙር ቻት ጂፒቲ ቴክኒካል ጂኖች ዓለም አቀፋዊ መለኪያ፡ ጄኔሬቲቭ AI በጂፒቲ ተከታታይ ትላልቅ ሞዴሎች ላይ የተመሰረተ፣ አጠቃላይ የንግግር ችሎታዎች እና አመክንዮአዊ አስተሳሰብ እንደ ዋና ጥቅሞቹ። ባለብዙ ቋንቋ ማቀነባበር፡ በእንግሊዘኛ ምርጡን ይሰራል፣ በቻይንኛ ቀጣይነት ያለው መሻሻል አለው፤ ግን እንግሊዝኛን ለ…

ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች

ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች

ዛሬ ከDeepSeek የወጣውን DeepSeekMath፡የሒሳብ ማመዛዘን ገደቦችን በክፍት ቋንቋ ሞዴሎች መግፋት የሚል ርዕስ ላካፍላችሁ። ይህ መጣጥፍ DeepSeekMath 7B ያስተዋውቃል፣ እሱም በDeepSeek-Coder-Base-v1.5 7B ላይ በ120B ሂሳብ-ነክ ቶከኖች፣ የተፈጥሮ ቋንቋ እና ኮድ መረጃዎች ስብስብ ላይ ቀድሞ የሰለጠነ ነው። ሞዴሉ በውድድር ደረጃ 51.7% አስደናቂ ነጥብ አስመዝግቧል…

DeepSeek-R1 ቴክኖሎጂ ተገለጠ፡ የወረቀቱ ዋና መርሆች ተከፋፈሉ እና የሞዴል አፈጻጸም ቁልፍ ተገለጠ።

ዛሬ DeepSeek R1ን እናካፍላለን፣ አርእስት፡ DeepSeek-R1፡ የማመዛዘን ችሎታን በኤል.ኤም.ኤል.ኤም በማጠናከሪያ ትምህርት በማበረታታት፡ የኤልኤልኤም የማመዛዘን ችሎታን በማጠናከሪያ ትምህርት ማበረታታት። ይህ ወረቀት የDeepSeek የመጀመሪያ ትውልድ የማመዛዘን ሞዴሎችን፣ DeepSeek-R1-ዜሮ እና DeepSeek-R1ን ያስተዋውቃል። የDeepSeek-R1-ዜሮ ሞዴል በትልቅ የማጠናከሪያ ትምህርት (RL) ያለ ክትትል የሚደረግበት ጥሩ ማስተካከያ (SFT) እንደ መጀመሪያ ደረጃ፣...