የምርጥ አራት ሞዴሎች ትርኢት! አንድ ግምገማ Deepseek R1 ምን ያህል ኃይለኛ እንደሆነ ያሳያል

የምርጥ አራት ሞዴሎች ትርኢት! አንድ ግምገማ Deepseek R1 ምን ያህል ኃይለኛ እንደሆነ ያሳያል

ባለፉት ጥቂት ቀናት ውስጥ Deepseek-R1 0528 በይፋ ክፍት-ምንጭ ተፈጥሯል። በ LiveCodeBench ላይ፣ አፈፃፀሙ ከOpenAI's o3 (ከፍተኛ) ጋር እኩል ነው ማለት ይቻላል። በአይደር የብዝሃ ቋንቋ ቤንችማርክ ፈተና እራሱን በክላውድ ኦፐስ ላይ ይይዛል። በይፋዊው ድረ-ገጽ ላይ ሲጀመር የፊት-መጨረሻ ችሎታውን በፍጥነት ሞከርን እና ልዩ ሆነው አግኝተናል…

DeepSeek-R1-0528 አዘምን፡ ጠለቅ ያለ አስተሳሰብ፣ ጠንካራ ምክንያት

የDeepSeek R1 ሞዴል አነስተኛ ስሪት ማሻሻያ አድርጓል፣ አሁን ያለው ስሪት DeepSeek-R1-0528 ነው። የDeepSeek ድረ-ገጽ ወይም መተግበሪያ ሲያስገቡ፣በንግግር በይነገጽ ውስጥ ያለውን የ"ጥልቅ አስተሳሰብ" ባህሪን ያንቁ የቅርብ ጊዜውን ስሪት። የDeepSeek-R1-0528 የሞዴል ክብደቶች ወደ HuggingFace ተጭነዋል ባለፉት አራት ወራት DeepSeek-R1 ታይቷል…

DeepSeek የምንጭ ኮዱን አውጥቷል፣ የFlashMLA ዝርዝር ማብራሪያ

DeepSeek የምንጭ ኮዱን አውጥቷል፣ የFlashMLA ዝርዝር ማብራሪያ

ባለፈው ሳምንት DeepSeek በሚቀጥለው ሳምንት አምስት ፕሮጀክቶችን እንደሚከፍት አስታውቋል፡ Netizens “በዚህ ጊዜ OpenAI በእርግጥ እዚህ አለ። ልክ አሁን፣ የመጀመሪያው ክፍት ምንጭ ፕሮጀክት መጣ፣ ከግንዛቤ ማጣደፍ፣ FlashMLA፡ ክፍት ምንጭ ፕሮጀክት አድራሻ፡ DeepSeek FlashMLA ለሁለት ሰዓታት ክፍት ምንጭ ሆኖ ቆይቷል፣ እና Github አስቀድሞ 2.7k+ ኮከቦች አሉት፡ The…

FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

FlashMLA በአርቴፊሻል ኢንተለጀንስ አለም በተለይም በትልልቅ ቋንቋ ሞዴሎች (LLMs) መስክ በፍጥነት ትኩረትን አግኝቷል። በDeepSeek የተገነባው ይህ ፈጠራ መሳሪያ ለሆፐር ጂፒዩዎች-ከፍተኛ አፈጻጸም ያላቸው ቺፕስ በተለምዶ በ AI ስሌት ውስጥ እንደ ተመቻቸ ዲኮዲንግ ከርነል ሆኖ ያገለግላል። FlashMLA በተለዋዋጭ-ርዝመት ቅደም ተከተሎች ቀልጣፋ ሂደት ላይ ያተኩራል፣ይህም በተለይ በጥሩ ሁኔታ ተስማሚ ያደርገዋል…

Qwen2.5-max vs DeepSeek R1፡ የሞዴሎች ጥልቅ ንጽጽር፡ የመተግበሪያ ሁኔታዎች ሙሉ ትንታኔ

Qwen2.5-max vs DeepSeek R1፡ የሞዴሎች ጥልቅ ንጽጽር፡ የመተግበሪያ ሁኔታዎች ሙሉ ትንታኔ

መግቢያ ዛሬ፣ ትልቅ የቋንቋ ሞዴሎች (LLMs) ወሳኝ ሚና ይጫወታሉ። እ.ኤ.አ. በ 2025 መጀመሪያ ላይ የ AI ፉክክር እየተጠናከረ ሲሄድ አሊባባ አዲሱን Qwen2.5-max AI ሞዴል ፈጠረ ፣ እና DeepSeek የተሰኘው ከቻይና ሃንግዙ ኩባንያ የኤል ኤም ኤል ቴክኖሎጂ ቁንጮ የሆነውን R1 ሞዴልን አስተዋወቀ። Deepseek R1 ስቧል ክፍት ምንጭ AI ሞዴል ነው…

ወደ DeepSeek-R1-32B ቅርብ ነው እና Fei-Fei Li's s1ን ያደቃል! ዩሲ በርክሌይ እና ሌሎች ክፍት ምንጭ አዲስ የ SOTA አመላካች ሞዴሎች

የ32ቢ ኢንፈረንስ ሞዴል ከመረጃው 1/8 ብቻ ይጠቀማል እና ከDeepSeek-R1 ተመሳሳይ መጠን ጋር የተሳሰረ ነው! ልክ አሁን፣ እንደ ስታንፎርድ፣ ዩሲ በርክሌይ፣ እና የዋሽንግተን ዩኒቨርሲቲ ያሉ ተቋማት በጋራ SOTA-ደረጃ ኢንፈረንስ ሞዴልን OpenThinker-32B አውጥተዋል እንዲሁም እስከ 114k የስልጠና መረጃዎችን ከፍተዋል። የክፍት ቲንክከር ፕሮጄክት መነሻ ገፅ፡ OpenThinker ማቀፍ ፊት፡…

ትልቅ የቋንቋ ሞዴል አስተዳደር ቅርሶች እንደ DeepSeek፡ Cherry Studio፣ Chatbox፣ AnythingLLM፣ የእርስዎ ቅልጥፍና አፋጣኝ ማነው?

ትልቅ የቋንቋ ሞዴል አስተዳደር ቅርሶች እንደ DeepSeek፡ Cherry Studio፣ Chatbox፣ AnythingLLM፣ የእርስዎ ቅልጥፍና አፋጣኝ ማነው?

ብዙ ሰዎች ቻትቦክስን እንደ ምስላዊ መሳሪያ በመጠቀም Deepseek Large Language Models በአካባቢው ማሰማራት እና መጠቀም ጀምረዋል። በ2025፣…

Le Chat ከመቶ ቢሊዮን ዶላር ኢንቨስትመንት ጋር በገበታው ላይ ቀዳሚ ነው። ከአሜሪካ እና ከቻይና በኋላ ሶስተኛው AI ሃይል ነው?

እ.ኤ.አ. የካቲት 9 የፈረንሳዩ ፕሬዝዳንት ኢማኑኤል ማክሮን በሚቀጥሉት ጥቂት ዓመታት ፈረንሳይ 109 ቢሊዮን ዩሮ (113 ቢሊዮን ዶላር) በ AI መስክ እንደምታፈስ አስታውቀዋል። ይህ ኢንቨስትመንት በፈረንሳይ የ AI ፓርክ ለመገንባት፣ መሠረተ ልማቱን ለማሻሻል እና በአካባቢው AI ጅምር ላይ ኢንቨስት ለማድረግ ይጠቅማል። ይህ በእንዲህ እንዳለ፣ የፈረንሳይ ጀማሪ ሚስትራል፣…

Deepseek ምን ሊያሳካ ይችላል? OpenAI እንኳን ማድረግ አይችልም?

የDeepSeek እውነተኛ ዋጋ ተገምቷል! DeepSeek-R1 ያለምንም ጥርጥር አዲስ የጋለ ስሜት ወደ ገበያው አምጥቷል። አግባብነት ያለው ተጠቃሚ የሚባሉት ኢላማዎች በከፍተኛ ሁኔታ እያደጉ መምጣታቸው ብቻ ሳይሆን አንዳንድ ሰዎች ከDeepSeek ጋር የተያያዙ ኮርሶችን እና ሶፍትዌሮችን በማዘጋጀት ገንዘብ ለማግኘት በመሞከር ላይ ይገኛሉ። ምንም እንኳን እነዚህ ክስተቶች የ…

የአለም ዋናዎቹ የኤአይአይ ምርቶች በመተንተን እና አጠቃላይ የተጠቃሚ ልምድ መመሪያዎች (DeepSeek እና GPTን ጨምሮ) ላይ ያተኩራሉ

የአለም ዋናዎቹ የኤአይአይ ምርቶች በመተንተን እና አጠቃላይ የተጠቃሚ ልምድ መመሪያዎች (DeepSeek እና GPTን ጨምሮ) ላይ ያተኩራሉ

የተግባር አቀማመጥ እና የዋና ጥቅማ ጥቅም ትንተና ChatGPT (OpenAI) - ለሁሉም-ዙር ቻት ጂፒቲ ቴክኒካል ጂኖች ዓለም አቀፋዊ መለኪያ፡ ጄኔሬቲቭ AI በጂፒቲ ተከታታይ ትላልቅ ሞዴሎች ላይ የተመሰረተ፣ አጠቃላይ የንግግር ችሎታዎች እና አመክንዮአዊ አስተሳሰብ እንደ ዋና ጥቅሞቹ። ባለብዙ ቋንቋ ማቀነባበር፡ በእንግሊዘኛ ምርጡን ይሰራል፣ በቻይንኛ ቀጣይነት ያለው መሻሻል አለው፤ ግን እንግሊዝኛን ለ…