በ AI ክበብ ውስጥ፣ DeepSeek R1 በአካላዊ ፈተናዎች ከኦ1 እና ክላውድ ያለማቋረጥ አልፏል፣ እና ወደ RL ወርቃማ ዘመን ገብተናል።

ማናችንም ብንሆን 2025 በ AI መስክ በዚህ መንገድ ይጀምራል ብለን አልጠበቅንም ነበር።

DeepSeek R1 በእውነት አስደናቂ ነው!

በቅርብ ጊዜ፣ “ሚስጥራዊው የምስራቃዊ ኃይል” DeepSeek ሲሊኮን ቫሊ “ጠንካራ ቁጥጥር” ነው።

የፒታጎሪያን ቲዎረምን በዝርዝር እንዲያብራራ R1 ጠየኩት። ይህ ሁሉ ያለ ምንም ስህተት ከ 30 ሰከንድ ባነሰ ጊዜ ውስጥ በ AI ተከናውኗል. በአጭሩ፣ አልቋል።

በአገር ውስጥ እና በውጭ AI ክበቦች ውስጥ ተራ ኔትወርኮች አስደናቂ እና ኃይለኛ አዲስ AI አግኝተዋል (ይህም ክፍት ምንጭ ነው) እና የአካዳሚክ ባለሙያዎች "መያዝ አለብን" ብለው ጮኹ. የባህር ማዶ የኤአይአይ ኩባንያዎች ከፍተኛ ስጋት እያጋጠማቸው ነው የሚሉ ወሬዎችም አሉ።

ልክ በዚህ ሳምንት የተለቀቀውን ይህን DeepSeek R1 ይውሰዱ። ምንም ዓይነት ክትትል የሚደረግበት ስልጠና ሳይኖር ንጹህ የማጠናከሪያ ትምህርት መንገዱ አስደንጋጭ ነው. ባለፈው አመት በዲሴምበር ወር ከዲፕሴክ-v3 መሰረት ልማት ጀምሮ እስከ አሁን ያለው የአስተሳሰብ ሰንሰለት አቅም ከOpenAI o1 ጋር የሚወዳደር የጊዜ ጉዳይ ይመስላል።

ነገር ግን የ AI ማህበረሰብ ቴክኒካል ሪፖርቶችን በማንበብ እና ትክክለኛ መለኪያዎችን በማነፃፀር ላይ ተጠምዶ ሳለ፣ ሰዎች አሁንም ስለ R1 ጥርጣሬዎች አሉባቸው፡ ከተወሰኑ ቤንችማርኮች በላቀ ደረጃ ከማድረግ በተጨማሪ፣ በእርግጥ ሊመራ ይችላል?

ማውጫ

የራሱን "የአካላዊ ህጎች" ምሳሌዎችን መገንባት ይችላል?

አታምኑም? ትልቁ ሞዴል በፒንቦል እንዲጫወት እንፍቀድ?

በቅርብ ቀናት ውስጥ፣ በ AI ማህበረሰብ ውስጥ ያሉ አንዳንድ ሰዎች የፈተና አባዜ ተጠምደዋል - ችግሩን ለመፍታት የተለያዩ AI ትላልቅ ሞዴሎችን (በተለይም የማመዛዘን ሞዴሎች የሚባሉትን) በመሞከር፡ “ቢጫ ኳስ በአንድ የተወሰነ ክፍል ውስጥ እንዲገባ ለማድረግ የ Python ስክሪፕት ይፃፉ። ቅርጽ. ቅርጹ በዝግታ እንዲሽከረከር ያድርጉ እና ኳሱ በቅርጹ ውስጥ መቆየቱን ያረጋግጡ።

አንዳንድ ሞዴሎች በዚህ "የሚሽከረከር ኳስ" መለኪያ ከሌሎች ይበልጣሉ። እንደ CoreView CTO ኢቫን ፊዮራቫንቲ፣ DeepSeek፣ የሀገር ውስጥ አርቴፊሻል ኢንተለጀንስ ላብራቶሪ፣ የOpenAI's o1 ፕሮ ሞዴልን የሚያሸንፍ ክፍት ምንጭ ትልቅ ሞዴል R1 አለው፣ እንደ OpenAI's ChatGPT Pro ፕሮግራም በወር $200 ያወጣል።

በግራ በኩል OpenAI o1 ነው፣ እና በቀኝ በኩል DeepSeek R1 ነው። ከላይ እንደተጠቀሰው፣ እዚህ ያለው ጥያቄ፡- “በአንድ ካሬ ውስጥ ለሚወዛወዝ ቢጫ ኳስ የፓይቶን ስክሪፕት ይፃፉ፣ የግጭት ማወቂያን በትክክል መያዙን ያረጋግጡ። ካሬውን ቀስ ብሎ እንዲዞር ያድርጉት. በ python ውስጥ ይተግብሩ. ኳሱ በካሬው ውስጥ መቆየቱን ያረጋግጡ።

በኤክስ ላይ ሌላ ተጠቃሚ እንዳለው አንትሮፖክ ክሎድ 3.5 ሶኔት እና የጎግል ጂሚኒ 1.5 ፕሮ ሞዴሎች ስለ አካላዊ መርሆች የተሳሳቱ ፍርዶችን በማድረጋቸው ኳሱ ከቅርጹ እንዲወጣ አድርጓል። አንዳንድ ተጠቃሚዎች እንዲሁ የGoogle የቅርብ ጊዜው Gemini 2.0 Flash Thinking Experimental እና በአንጻራዊነት የቆየው OpenAI GPT-4o በአንድ ጊዜ ግምገማውን እንዳለፉ ዘግበዋል።

እዚህ ግን ልዩነቱን የሚለይበት መንገድ አለ፡-

በዚህ ትዊተር ስር ያሉ ኔትዎርኮች እንዳሉት፡ የ o1 ችሎታ በመጀመሪያ በጣም ጥሩ ነበር ነገር ግን OpenAI ፍጥነቱን ካመቻቸ በኋላ በ$200/ወር የአባልነት ስሪት እንኳን ደካማ ሆነ።

የሚወዛወዝ ኳስ ማስመሰል የተለመደ የፕሮግራም ፈተና ነው። ትክክለኛ ማስመሰል የግጭት ማወቂያ ስልተ ቀመሮችን ያጣምራል፣ እነዚህ ሁለት ነገሮች (እንደ ኳስ እና የቅርጽ ጎን ያሉ) ሲጋጩ መለየት አለባቸው። በአግባቡ ያልተፃፈ ስልተ-ቀመር የአስመሳይን አፈፃፀም ላይ ተጽእኖ ሊያሳድር ወይም ግልጽ የሆኑ አካላዊ ስህተቶችን ሊያስከትል ይችላል.

N8 Programs፣ የ AI startup Nous ምርምር ተመራማሪ፣ ከባዶ በሚሽከረከር ሄፕታጎን ውስጥ ኳስ ለመፃፍ ሁለት ሰዓት ያህል እንደፈጀበት ተናግሯል። "በርካታ የተቀናጁ ስርዓቶች መከታተል አለባቸው፣ በእያንዳንዱ ስርአት ውስጥ ግጭቶች እንዴት እንደሚስተናገዱ መረዳት እንደሚያስፈልግ እና ኮዱ ጠንካራ እንዲሆን ከባዶ መቅረጽ አለበት።"

ምንም እንኳን ኳሶችን መወርወር እና ማሽከርከር የፕሮግራም ችሎታዎች ምክንያታዊ ፈተና ቢሆኑም አሁንም ለትላልቅ ሞዴሎች አዲስ ፕሮጀክቶች ናቸው እና በጥያቄዎች ላይ ትንሽ ለውጦች እንኳን የተለያዩ ውጤቶችን ያስገኛሉ። ስለዚህ ውሎ አድሮ ለትልቅ AI ሞዴሎች የቤንችማርክ ፈተና አካል ከሆነ አሁንም መሻሻል አለበት።

ያም ሆነ ይህ, ከዚህ የተግባር ፈተናዎች ሞገድ በኋላ, በትላልቅ ሞዴሎች መካከል ያለውን የችሎታ ልዩነት ግንዛቤ አለን.

DeepSeek አዲሱ “የሲሊኮን ቫሊ ተረት ነው።

DeepSeek በፓስፊክ ውቅያኖስ ላይ ሽብር እየፈጠረ ነው።

የሜታ ሰራተኞች “የሜታ መሐንዲሶች DeepSeekን ማንኛውንም ነገር ከሱ ለመቅዳት በከፍተኛ ሁኔታ እየተተነተኑ ነው” ሲሉ ለጥፈዋል።

የ AI ቴክኖሎጂ ጅምር ስኬል AI መስራች አሌክሳንድር ዋንግ የDeepSeek AI ትልቅ ሞዴል አፈጻጸም በዩናይትድ ስቴትስ ካለው ምርጥ ሞዴል ጋር እኩል መሆኑን በይፋ ተናግሯል።

በተጨማሪም ዩናይትድ ስቴትስ ባለፉት አስርት ዓመታት ውስጥ በ AI ውድድር ከቻይና ቀድማ ሊሆን ይችላል ብሎ ያምናል፣ ነገር ግን DeepSeek የ AI ትልቅ ሞዴሉን መልቀቅ “ሁሉንም ነገር ሊለውጥ ይችላል።

X Blogger @8teAPi DeepSeek “የጎን ፕሮጀክት” ሳይሆን እንደ ሎክሄድ ማርቲን የቀድሞ “ስኩንክ ሥራዎች” ነው ብሎ ያምናል።

"Skunk Works" እየተባለ የሚጠራው ሎክሄድ ማርቲን ብዙ የተራቀቁ አውሮፕላኖችን ለማዘጋጀት በመጀመሪያ ያቋቋመው እጅግ በጣም ሚስጥራዊ፣ በአንጻራዊነት ራሱን የቻለ አነስተኛ ቡድን ነው፣ በቴክኖሎጂ ምርምር እና ምርምር ላይ የተሰማራ። ከ U-2 የስለላ አውሮፕላኖች እና SR-71 ብላክበርድ እስከ F-22 Raptor እና F-35 Lightning II ተዋጊ ድረስ ሁሉም ከዚህ መጡ።

በኋላ፣ ቃሉ ቀስ በቀስ ወደ አጠቃላይ ቃል ተለውጧል “ትንሽ ግን ጥሩ”፣ በአንጻራዊ ሁኔታ ገለልተኛ እና በትላልቅ ኩባንያዎች ወይም ድርጅቶች ውስጥ የተቋቋሙ ይበልጥ ተለዋዋጭ የፈጠራ ቡድኖች።

ሁለት ምክንያቶችን ሰጥቷል።

በአንድ በኩል፣ DeepSeek በርካታ ቁጥር ያላቸው ጂፒዩዎች ያሉት ሲሆን ከ10,000 በላይ እንደሚሆኑ የተነገረለት እና የ Scale AI ዋና ስራ አስፈፃሚ አሌክሳንድር ዋንግ 50,000 ሊደርስ እንደሚችልም ተናግሯል።
በሌላ በኩል DeepSeek በቻይና ውስጥ ካሉት ምርጥ ሶስት ዩኒቨርሲቲዎች ተሰጥኦዎችን ብቻ ነው የሚቀጥረው ይህም ማለት DeepSeek እንደ አሊባባ እና ቴንሰንት ተወዳዳሪ ነው።

እነዚህ ሁለት እውነታዎች ብቻ እንደሚያሳዩት DeepSeek የንግድ ስኬትን በግልፅ እንዳስመዘገበ እና እነዚህን ሀብቶች ለማግኘት በበቂ ሁኔታ የታወቀ ነው።

የDeepSeek የልማት ወጪን በተመለከተ የቻይና የቴክኖሎጂ ኩባንያዎች የተለያዩ ድጎማዎችን ለምሳሌ አነስተኛ የኤሌክትሪክ ወጪ እና የመሬት አጠቃቀምን ሊያገኙ እንደሚችሉ ጦማሪው ተናግሯል።

ስለዚህ፣ አብዛኛው የDeepSeek ወጪዎች ከዋናው ቢዝነስ ውጭ በሆነ አካውንት ውስጥ ወይም በአንድ ዓይነት የመረጃ ማዕከል ግንባታ ድጎማ መልክ “የተቀመጡ” ሊሆኑ ይችላሉ።

ከመስራቾቹ በስተቀር ማንም ሰው ሁሉንም የፋይናንስ ዝግጅቶች ሙሉ በሙሉ አይረዳም. አንዳንድ ስምምነቶች በቀላሉ መልካም ስም ላይ ተመስርተው የሚጠናቀቁ “የቃል ስምምነቶች” ሊሆኑ ይችላሉ።

ምንም ይሁን ምን, ጥቂት ነገሮች ግልጽ ናቸው:

ሞዴሉ በጣም ጥሩ ነው፣ ከሁለት ወራት በፊት በOpenAI ከተለቀቀው ስሪት ጋር ሊወዳደር ይችላል፣ እና በእርግጥ OpenAI እና Anthropic ገና ያልለቀቁትን አዳዲስ ሞዴሎችን ያህል ጥሩ ላይሆን ይችላል።
አሁን ካለው እይታ አንጻር የምርምር አቅጣጫ አሁንም በአሜሪካ ኩባንያዎች ቁጥጥር ስር ነው. የDeepSeek ሞዴል የ o1 ስሪት “ፈጣን ክትትል” ነው፣ ነገር ግን የDeepSeek የምርምር እና የእድገት ግስጋሴ ከተጠበቀው በላይ እየፈጠነ ነው። እነሱ ማጭበርበር ወይም ማጭበርበር አይደሉም ፣ ቢበዛ እነሱ የተገላቢጦሽ ምህንድስና ናቸው።
DeepSeek በዋናነት የራሱን ተሰጥኦ በማሰልጠን ላይ ይገኛል፣ ይልቁንም በአሜሪካ በሰለጠኑ ፒኤችዲዎች ላይ ከመተማመን፣ ይህም የችሎታ ገንዳውን በእጅጉ ያሰፋል።
ከአሜሪካ ኩባንያዎች ጋር ሲወዳደር DeepSeek በአእምሯዊ ንብረት ፈቃድ፣ግላዊነት፣ደህንነት፣ፖለቲካ፣ወዘተ ውስን ገደቦች ተጋርጦበታል እና ሰዎች እንዲሰለጥኑበት የማይፈልጉትን አላግባብ አጠቃቀም ላይ የሚያሳስቧቸው ነገሮች ጥቂት ናቸው። ያነሱ ክሶች፣ ጥቂት ጠበቆች እና ጥቂት ስጋቶች አሉ።

2025 ወሳኝ ዓመት እንደሚሆን ብዙ ሰዎች እንደሚያምኑ ምንም ጥርጥር የለውም። እስከዚያው ድረስ ኩባንያዎች ለእሱ እየተዘጋጁ ናቸው. ለምሳሌ ሜታ የ2GW+ ዳታ ሴንተር በመገንባት ላይ ሲሆን በ2025 ከ$60-65 ቢሊዮን የሚገመት ኢንቨስትመንት እና በዓመቱ መጨረሻ ከ1.3 ሚሊዮን በላይ ጂፒዩዎች ይኖሩታል።

ሜታ ባለ 2-ጂጋ ዋት የመረጃ ማዕከሉን ከማንሃተን፣ ኒው ዮርክ ጋር ለማነጻጸር ቻርት እንኳን ተጠቅሟል።

አሁን ግን DeepSeek በአነስተኛ ወጪ እና ባነሰ ጂፒዩዎች የተሻለ ሰርቷል። ይህ እንዴት ሰዎችን አያስጨንቅም?

Yann LeCun: CTO እና ተባባሪ መስራች ማመስገን አለብን የ ክፍት ምንጭ

ሃይፐርቦሊክ፣ ዩቸን ጂን በ4 ቀናት ውስጥ ለመለጠፍ DeepSeek-R1 4 እውነታዎችን አረጋግጦልናል፡-

ክፍት ምንጭ AI ከተዘጋው ምንጭ AI በ6 ወር ብቻ ነው ያለው
ቻይና የክፍት ምንጭ AI ውድድርን እየተቆጣጠረች ነው።
ትልቅ የቋንቋ ሞዴል ማጠናከሪያ ትምህርት ወደ ወርቃማው ዘመን እየገባን ነው።
የዲቲልቴሽን ሞዴሎች በጣም ኃይለኛ ናቸው, እና በሞባይል ስልኮች ላይ ከፍተኛ የማሰብ ችሎታ ያለው AI እንሰራለን

በ DeepSeek የተቀሰቀሰው የሰንሰለት ምላሽ አሁንም እንደቀጠለ ነው፣እንደ OpenAI o3-mini በነጻነት እንዲገኝ መደረጉ፣በህብረተሰቡ ውስጥ ስለ AGI/ASI የሚደረጉ ግልጽ ያልሆኑ ውይይቶችን የመቀነስ ተስፋ እና ሜታ በፍርሃት ውስጥ ወድቋል የሚለው ወሬ።

በመጨረሻ ማን እንደሚያሸንፍ መተንበይ ከባድ እንደሆነ ያምናል፣ ነገር ግን ዘግይቶ የመጣውን ጥቅም ኃይል መርሳት የለብንም ። ደግሞም ፣ ትራንስፎርመርን የፈለሰፈው ጉግል መሆኑን ሁላችንም እናውቃለን ፣ ግን OpenAI እውነተኛ አቅሙን ከፍቷል።

በተጨማሪም የቱሪንግ ሽልማት አሸናፊ እና የሜታ ዋና AI ሳይንቲስት ያን ሌኩን ሃሳባቸውን ገለፁ።

“የDeepSeek አፈጻጸምን ሲያዩ፣ 'ቻይና በ AI ውስጥ ዩኤስን እየቀዳለች ነው' ብለው ለሚያስቡ፣ ተሳስተዋል። ትክክለኛው ግንዛቤ የክፍት ምንጭ ሞዴሎች የባለቤትነት ሞዴሎችን እየቀደሙ መሆናቸው ነው።

ሌኩን እንዳሉት DeepSeek በዚህ ጊዜ እንዲህ አይነት ብልጭታ የፈጠረበት ምክንያት ክፍት ምርምር እና ክፍት ምንጭ (እንደ ሜታ ፒይቶርች እና ላማ ያሉ) ጥቅም በማግኘታቸው ነው። DeepSeek አዳዲስ ሀሳቦችን ይዞ በሌሎች ስራ ላይ የተገነባ ነው። ስራቸው በይፋ የተለቀቀ እና ክፍት ምንጭ ስለሆነ ሁሉም ሰው ሊጠቀምበት ይችላል. ይህ ክፍት ምርምር እና ክፍት ምንጭ ኃይል ነው.

የኔትዚን ነፀብራቅ ቀጥሏል። ስለ አዳዲስ ቴክኖሎጂዎች እድገት በጣም ቢደሰቱም, ትንሽ የጭንቀት ሁኔታ ሊሰማቸው ይችላል. ከሁሉም በላይ, የ DeepSeekers ብቅ ማለት እውነተኛ ተጽእኖ ሊኖረው ይችላል.

በ AI ክበብ ውስጥ፣ DeepSeek R1 በአካላዊ ፈተናዎች ከኦ1 እና ክላውድ ያለማቋረጥ አልፏል፣ እና ወደ RL ወርቃማ ዘመን ገብተናል።

የራሱን "የአካላዊ ህጎች" ምሳሌዎችን መገንባት ይችላል?

DeepSeek አዲሱ “የሲሊኮን ቫሊ ተረት ነው።

Yann LeCun: CTO እና ተባባሪ መስራች ማመስገን አለብን የ ክፍት ምንጭ

ጎግል በአንድ ጊዜ ሶስት አዳዲስ ሞዴሎችን አውጥቷል፡ Gemini-2.0-Pro ነፃ ነው፣ ምርጥ ነጥብ ያለው እና አንደኛ ደረጃ የያዘው እና ውስብስብ ጥያቄዎችን ለኮድ እና ለመስራት ተስማሚ ነው!

ሰበር ዜና! የ DeepSeek ተመራማሪ በመስመር ላይ እንደገለፀው፡ የ R1 ስልጠና ከሁለት እስከ ሶስት ሳምንታት ብቻ የፈጀ ሲሆን በቻይናውያን አዲስ አመት በዓል ላይ የ R1 ዜሮ ዝግመተ ለውጥ ታይቷል

ከ DeepSeek 1 ጀርባ ያለው ሚስጥር | DeepSeekMath እና GRPO ዝርዝሮች

OpenAI o3-mini vs. DeepSeek-R1፡ የአዲሱ ትውልድ AI ሞዴሎች ንጉስ ማን ነው?

FlashMLA ምንድን ነው? በ AI ዲኮዲንግ ከርነሎች ላይ ለሚኖረው ተጽእኖ አጠቃላይ መመሪያ

Paper-DeepSeek-R1፡ በማጠናከሪያ ትምህርት በኤልኤልኤምዎች የማመዛዘን ችሎታን ማበረታታት

ምላሽ ይስጡ ምላሽ ሰርዝ

የራሱን "የአካላዊ ህጎች" ምሳሌዎችን መገንባት ይችላል?

DeepSeek አዲሱ “የሲሊኮን ቫሊ ተረት ነው።

Yann LeCun: CTO እና ተባባሪ መስራች ማመስገን አለብን የ ክፍት ምንጭ

ተመሳሳይ ልጥፎች

ምላሽ ይስጡ ምላሽ ሰርዝ