ያልተመደበ - Deepseek R1

ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች

ያልተመደበ

ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች

በzd1TP7ቴር የካቲት 9 ቀን 2025 ዓ.ምየካቲት 9 ቀን 2025 ዓ.ም

ዛሬ ከDeepSeek የወጣውን DeepSeekMath፡የሒሳብ ማመዛዘን ገደቦችን በክፍት ቋንቋ ሞዴሎች መግፋት የሚል ርዕስ ላካፍላችሁ። ይህ መጣጥፍ DeepSeekMath 7B ያስተዋውቃል፣ እሱም በDeepSeek-Coder-Base-v1.5 7B ላይ በ120B ሂሳብ-ነክ ቶከኖች፣ የተፈጥሮ ቋንቋ እና ኮድ መረጃዎች ስብስብ ላይ ቀድሞ የሰለጠነ ነው። ሞዴሉ በውድድር ደረጃ 51.7% አስደናቂ ነጥብ አስመዝግቧል…

ያልተመደበ

DeepSeek-R1 ቴክኖሎጂ ተገለጠ፡ የወረቀቱ ዋና መርሆች ተከፋፈሉ እና የሞዴል አፈጻጸም ቁልፍ ተገለጠ።

በzd1TP7ቴር የካቲት 9 ቀን 2025 ዓ.ምየካቲት 9 ቀን 2025 ዓ.ም

ዛሬ DeepSeek R1ን እናካፍላለን፣ አርእስት፡ DeepSeek-R1፡ የማመዛዘን ችሎታን በኤል.ኤም.ኤል.ኤም በማጠናከሪያ ትምህርት በማበረታታት፡ የኤልኤልኤም የማመዛዘን ችሎታን በማጠናከሪያ ትምህርት ማበረታታት። ይህ ወረቀት የDeepSeek የመጀመሪያ ትውልድ የማመዛዘን ሞዴሎችን፣ DeepSeek-R1-ዜሮ እና DeepSeek-R1ን ያስተዋውቃል። የDeepSeek-R1-ዜሮ ሞዴል በትልቅ የማጠናከሪያ ትምህርት (RL) ያለ ክትትል የሚደረግበት ጥሩ ማስተካከያ (SFT) እንደ መጀመሪያ ደረጃ፣...

ያልተመደበ

DeepSeek R1 የወረቀት ትርጓሜ እና ቁልፍ ቴክኒካዊ ነጥቦች

በzd1TP7ቴር የካቲት 9 ቀን 2025 ዓ.ምየካቲት 9 ቀን 2025 ዓ.ም

1 ዳራ በፀደይ ፌስቲቫል ወቅት፣ DeepSeek R1 በድጋሚ ሰፊ ትኩረትን ስቧል፣ እና ከዚህ ቀደም የፃፍነው DeepSeek V3 የትርጉም መጣጥፍ እንኳን እንደገና ተላልፎ ብዙ ውይይት ተደርጎበታል። ምንም እንኳን የ DeepSeek R1 ብዙ ትንታኔዎች እና ማባዛቶች ቢኖሩም, እዚህ አንዳንድ ተዛማጅ የንባብ ማስታወሻዎችን ለማዘጋጀት ወስነናል. ሶስት እንጠቀማለን…

ዝቅተኛ ዋጋ ያለው የጎግል ሞዴል ጀሚኒ 2.0 ተከታታዮች እያጠቁ ነው፡ በትልልቅ ሞዴሎች ለዋጋ ቆጣቢነት የሚደረገው ውጊያ እየተጠናከረ ነው።

ያልተመደበ

ዝቅተኛ ዋጋ ያለው የጎግል ሞዴል ጀሚኒ 2.0 ተከታታዮች እያጠቁ ነው፡ በትልልቅ ሞዴሎች ወጪ ቆጣቢነት ውጊያው እየተጠናከረ ነው

በzd1TP7ቴር የካቲት 8, 2025የካቲት 8, 2025

ብዙ የኤአይአይ አፕሊኬሽኖች ገና ያልተተገበሩበት እና ያልተዋወቁበት ትልቅ ምክንያት ትልቅ የኤአይአይ ሞዴሎችን የመጠቀም ከፍተኛ ወጪ ነው። ከፍተኛ አፈጻጸምን መምረጥ ትልቅ የኮምፒዩተር ሃይል ወጪዎች ማለት ሲሆን ይህም ተራ ተጠቃሚዎች ሊቀበሉት የማይችሉትን ከፍተኛ የአጠቃቀም ወጪን ያስከትላል። ለትልቅ AI ሞዴሎች ውድድር እንደ ጭስ ያለ ጦርነት ነው. በኋላ…

Gemini 2.0 ገበታዎቹን ይቆጣጠራል፣ DeepSeek V3 በዋጋው ሲያለቅስ፣ እና አዲስ ወጪ ቆጣቢ ሻምፒዮን ተወለደ!

ያልተመደበ

Gemini 2.0 ገበታዎቹን ይቆጣጠራል፣ DeepSeek V3 በዋጋው ሲያለቅስ፣ እና አዲስ ወጪ ቆጣቢ ሻምፒዮን ተወለደ!

በzd1TP7ቴር የካቲት 8, 2025የካቲት 8, 2025

የGoogle Gemini 2.0 ቤተሰብ በመጨረሻ ተጠናቅቋል! ልክ እንደተለቀቀ ገበታዎቹን ይቆጣጠራል። በ Deepseek፣ Qwen እና o3 ፍለጋ እና እገዳዎች መካከል ጎግል ዛሬ ማለዳ ላይ ሶስት ሞዴሎችን በአንድ ጊዜ ለቋል፡ Gemini 2.0 Pro፣ Gemini 2.0 Flash እና Gemini 2.0 Flash-Lite። በትልቁ ሞዴል LMSYS ደረጃዎች ላይ፣ ጀሚኒ…

የ a16z ውይይት ከ 27 አመቱ ዋና ሥራ አስፈፃሚ ጋር፡ AI ወኪል ትልቅ ጥቅም አለው፣ እና የረጅም ጊዜ ዋጋ ከጉልበት ወጪዎች ጋር ይያያዛል።

ያልተመደበ

የ a16z ውይይት ከ 27 አመቱ ዋና ሥራ አስፈፃሚ ጋር፡ AI ወኪል ትልቅ ጥቅም አለው፣ እና የረጅም ጊዜ ዋጋ ከጉልበት ወጪዎች ጋር ይያያዛል።

በzd1TP7ቴር የካቲት 8, 2025የካቲት 8, 2025

ዋና ዋና ዜናዎች AI ወኪል የደንበኞችን ልምድ ይቀይሳል ጄሲ ዣንግ፡ አንድ ወኪል በትክክል እንዴት ነው የሚገነባው? የእኛ አመለካከት ከጊዜ በኋላ እንደ ተፈጥሯዊ ቋንቋ-ተኮር ወኪል ይሆናል ምክንያቱም ትላልቅ የቋንቋ ሞዴሎች (LLMs) የሚሰለጥኑት በዚህ መንገድ ነው። በረጅም ጊዜ ውስጥ፣ በጣም አስተዋይ ወኪል ካለዎት…

ያልተመደበ

Cathie Wood: DeepSeek የወጪ ቅነሳ ሂደቱን ማፋጠን ብቻ ነው; ከታላቁ የኢኮኖሚ ድቀት ጋር የሚወዳደር እጅግ የተጠናከረ የገበያ መዋቅር ይለወጣል

በzd1TP7ቴር የካቲት 8, 2025የካቲት 8, 2025

ድምቀቶች ከ DeepSeek ጋር የሚደረግ ውድድር ለዩኤስ ካቲ ዉድ ጥሩ ነው፡ እኔ እንደማስበው የፈጠራ ዋጋ በከፍተኛ ሁኔታ እየቀነሰ መምጣቱን እና ይህ አዝማሚያ አስቀድሞ መጀመሩን ያሳያል። ለምሳሌ፣ ከDeepSeek በፊት፣ አርቴፊሻል ኢንተለጀንስ የማሰልጠን ወጪ በዓመት በ75% ቀንሷል፣ እና የፍተሻ ዋጋ በ85% እስከ…

ያልተመደበ

ጎግል በአንድ ጊዜ ሶስት አዳዲስ ሞዴሎችን አውጥቷል፡ Gemini-2.0-Pro ነፃ ነው፣ ምርጥ ነጥብ ያለው እና አንደኛ ደረጃ የያዘው እና ውስብስብ ጥያቄዎችን ለኮድ እና ለመስራት ተስማሚ ነው!

በzd1TP7ቴር የካቲት 8, 2025የካቲት 8, 2025

የጌሚኒ 2.0 ታሪክ እየተፋጠነ ነው። በዲሴምበር ውስጥ ያለው የፍላሽ አስተሳሰብ የሙከራ ስሪት ገንቢዎች ዝቅተኛ መዘግየት እና ከፍተኛ አፈጻጸም ያለው የስራ ሞዴል አምጥቷል። በዚህ አመት መጀመሪያ ላይ የፍላሽ ፍጥነትን ከተሻሻሉ የማመዛዘን ችሎታዎች ጋር በማጣመር አፈፃፀሙን የበለጠ ለማሻሻል 2.0 Flash Thinking Experimental በጎግል AI ስቱዲዮ ተዘምኗል። ባለፈው ሳምንት፣…

DeepSeek TOP17 ምርጥ አማራጮች፡ አጠቃላይ ትንታኔ (2025)

ያልተመደበ

DeepSeek TOP17 ምርጥ አማራጮች፡ አጠቃላይ ትንታኔ (2025)

በ1TP7ቴር የካቲት 6, 2025የካቲት 6, 2025

መግቢያ በአርቴፊሻል ኢንተለጀንስ በፍጥነት በማደግ ላይ ባለው የመሬት ገጽታ፣ DeepSeek እንደ ኃይለኛ የቋንቋ ሞዴል ብቅ ብሏል። ይህ አጠቃላይ ትንታኔ ከDeepSeek ዋና ዋና 17 አማራጮችን ይዳስሳል፣ ልዩ ባህሪያቸውን፣ አቅማቸውን እና የአጠቃቀም ጉዳዮችን ይመረምራል። የእኛ ምርምር DeepSeek ውህደትን ወይም ተመሳሳይ ችሎታዎችን በሚያቀርቡ በሁለቱም ዓለም አቀፍ እና የቻይና መድረኮች ላይ ያተኩራል። ከፍተኛ አማራጮች ትንተና 1….

ያልተመደበ

አሊ Qwen2.5-ማክስ DeepSeek-V3 አልፏል! ኔትዘን፡- የቻይናው AI በፍጥነት ክፍተቱን እየዘጋ ነው።

በzd1TP7ቴር የካቲት 5, 2025የካቲት 5, 2025

ልክ አሁን፣ ሌላ የአገር ውስጥ ሞዴል በ Big Model Arena ዝርዝር ውስጥ ከአሊ፣ Qwen2.5-Max ተጨምሯል፣ እሱም DeepSeek-V3 በልጦ በአጠቃላይ 1332 ነጥብ በማስመዝገብ ሰባተኛ ደረጃ ላይ ተቀምጧል። በተለይም በፕሮግራም አወጣጥ የላቀ…