DeepSeek እንዴት ተፈጠረ? የDeepSeek የእድገት ታሪክ ትንተና
ለወደፊቱ, የበለጠ እና የበለጠ የሃርድኮር ፈጠራዎች ይኖራሉ. አሁን ለመረዳት ቀላል ላይሆን ይችላል፣ ምክንያቱም መላው የህብረተሰብ ቡድን በእውነታዎች መማር አለበት። ይህ ማህበረሰብ ሃርድኮርን የሚፈጥሩ ሰዎች እንዲሳካላቸው ሲፈቅድ የጋራ አስተሳሰብ ይለወጣል። እኛ የምንፈልገው ብዙ እውነታዎች እና ሂደት ብቻ ነው….
ለወደፊቱ, የበለጠ እና የበለጠ የሃርድኮር ፈጠራዎች ይኖራሉ. አሁን ለመረዳት ቀላል ላይሆን ይችላል፣ ምክንያቱም መላው የህብረተሰብ ቡድን በእውነታዎች መማር አለበት። ይህ ማህበረሰብ ሃርድኮርን የሚፈጥሩ ሰዎች እንዲሳካላቸው ሲፈቅድ የጋራ አስተሳሰብ ይለወጣል። እኛ የምንፈልገው ብዙ እውነታዎች እና ሂደት ብቻ ነው….
OpenAI የ o3-ሚኒ ሞዴሉን ከለቀቀ በኋላ, ዋና ሥራ አስፈፃሚው ሳም አልትማን, ዋና የምርምር ኦፊሰር ማርክ ቼን, ዋና የምርት ኦፊሰር ኬቨን ዌይል; የኢንጂነሪንግ ስሪኒቫስ ናራያናን ምክትል ፕሬዝዳንት፣ የኤፒአይ ጥናትና ምርምር ኃላፊ ሚሼል ፖክራስ እና የምርምር ሆንግዩ ሬን ከአለም ትልቁ አጠቃላይ መድረኮች አንዱ በሆነው በሬዲት ላይ የመስመር ላይ ቴክኒካል ጥያቄ እና መልስ አካሂደዋል። ዋናዎቹ ርዕሰ ጉዳዮች…
o3-ሚኒ ከተፎካካሪው ፍጥነት ጋር በጃንዋሪ 31፣ OpenAI አዲሱን o3-ሚኒ ትልቅ ሞዴል አውጥቶ የተወሰኑ ተግባሮቹን ለሁሉም የChatGPT ተጠቃሚዎች በነጻ ሰጥቷል። ምንም እንኳን በጥያቄዎች ብዛት ላይ ገደብ ቢኖርም ተጠቃሚዎች በተቻለ ፍጥነት የOpenAI የቅርብ ጊዜ የንግድ ሞዴልን እንዲለማመዱ ያስችላቸዋል….
DeepSeek-R1 እና DeepSeek-V3 ክፍት ምንጫቸው ከተጀመረበት ጊዜ ጀምሮ አለም አቀፍ ስሜትን ፈጥረዋል። እነሱ ከDeepSeek ቡድን ለሰው ልጆች ሁሉ የተሰጡ ስጦታዎች ናቸው፣ እና ለስኬታቸው ከልብ ደስተኞች ነን። በሲሊኮን ሞቢሊቲ እና የሁዋዌ ክላውድ ቡድኖች ለቀናት ጠንክሮ ከሰራ በኋላ ዛሬ ለቻይና ተጠቃሚዎች ቻይንኛ እየሰጠን ነው።
OpenAI የቅርብ ጊዜውን የኢንፈረንስ ሞዴሉን አውጥቷል፣ o3-mini፣ እሱም እንደ ሳይንስ፣ ሂሳብ እና ፕሮግራሚንግ ላሉ መስኮች የተመቻቸ፣ ፈጣን ምላሽ፣ ከፍተኛ ትክክለኛነት እና ዝቅተኛ ወጪ። ከቀድሞው o1-ሚኒ ጋር ሲነጻጸር፣ o3-mini የመረዳት አቅሙን በተለይም ውስብስብ ችግሮችን በመፍታት ረገድ በእጅጉ አሻሽሏል። ሞካሪዎች የ o3-ሚኒ መልሶችን በ 56% ይመርጣሉ፣ እና የስህተት መጠኑ…
ማናችንም ብንሆን 2025 በ AI መስክ በዚህ መንገድ ይጀምራል ብለን አልጠበቅንም ነበር። DeepSeek R1 በእውነት አስደናቂ ነው! በቅርብ ጊዜ፣ “ሚስጥራዊው የምስራቃዊ ኃይል” DeepSeek ሲሊኮን ቫሊ “ጠንካራ ቁጥጥር” ነው። የፒታጎሪያን ቲዎረምን በዝርዝር እንዲያብራራ R1 ጠየኩት። ይህ ሁሉ በ AI የተደረገው ከ30 ሰከንድ ባነሰ ጊዜ ውስጥ ያለ ምንም…
o3-ሚኒ እና o3-ሚኒ (ከፍተኛ) ዛሬ ይለቀቃሉ። መደበኛ ተጠቃሚዎች ደግሞ o3-mini ያገኛሉ፣ እና በተጨማሪም ተጠቃሚዎች o3-mini (ከፍተኛ) መጠቀም ይችላሉ። o3-ሚኒ (ከፍተኛ) በ Codeforce ከ o1 በ200 ነጥብ ከፍ ያለ ነው፣ ከ o1 ፈጣን ነው፣ እና በኮድ እና በሂሳብ የተሻለ ይሰራል፣ ነገር ግን ዋጋው አሁንም በ o1-ሚኒ ደረጃ ላይ ነው….
o3-ሚኒ በሌሊት ደረሰ፣ እና OpenAI በመጨረሻ የቅርብ ጊዜውን የመለከት ካርድ አሳይቷል። በ Reddit AMA Q&A ወቅት፣ Altman በክፍት ምንጭ AI የተሳሳተ ጎን ላይ እንደቆመ በጥልቅ አምኗል። የክፍት ምንጭ የውስጥ ስትራቴጂ እየተታሰበበት ነው፣ እና ሞዴሉ በቀጣይነት መዘጋጀቱን ይቀጥላል፣ ነገር ግን...
Abstract ይህ ወረቀት የDeepSeek የመጀመሪያ-ትውልድ የማመዛዘን ሞዴሎችን ያስተዋውቃል፡ DeepSeek-R1-ዜሮ እና DeepSeek-R1። DeepSeek-R1-ዜሮ፣ በትልቅ የማጠናከሪያ ትምህርት (RL) ያለ ክትትል የሚደረግበት ጥሩ ማስተካከያ (SFT)፣ አስደናቂ የማመዛዘን ችሎታዎችን ያሳያል። በ RL በኩል፣ በተፈጥሮ ኃይለኛ የማመዛዘን ባህሪያትን ያዳብራል። ሆኖም፣ እንደ ደካማ ተነባቢነት እና የቋንቋ መደባለቅ ያሉ ተግዳሮቶች ገጥመውታል። እነዚህን ችግሮች ለመፍታት እና የማመዛዘን አፈጻጸምን ለማሻሻል DeepSeek-R1 ተዘጋጅቷል፣…