ለወደፊቱ, የበለጠ እና የበለጠ የሃርድኮር ፈጠራዎች ይኖራሉ. አሁን ለመረዳት ቀላል ላይሆን ይችላል, ምክንያቱም መላው ማህበራዊ ቡድን በእውነታዎች መማር አለበት. ይህ ማህበረሰብ ሃርድኮርን የሚፈጥሩ ሰዎች እንዲሳካላቸው ሲፈቅድ የጋራ አስተሳሰብ ይለወጣል። እኛ የምንፈልገው ብዙ እውነታዎች እና ሂደት ብቻ ነው። - Liang Wenfeng, DeepSeek መስራች

በቅርብ ቀናት ውስጥ, DeepSeek በመላው ዓለም ፈንድቷል, ነገር ግን ኩባንያው በጣም ዝቅተኛ-ቁልፍ ስለሆነ እና ምንም ማስታወቂያዎች አላደረገም, ሕዝቡ ስለ ታላቅ አቅም ያለው ስለዚህ የቴክኖሎጂ ኩባንያ በጣም ጥቂት የሚያውቀው - መስራች ጀርባ, የንግድ ወሰን ይሁን. , ወይም የምርት አቀማመጥ.

ሁሉንም ቁሳቁሶች መደርደር ከጨረስኩ በኋላ, ይህን ጽሑፍ ጻፍኩ

አሁን ያሉት የ AI ተጫዋቾች ዳራ ምንድን ነው, ምን ላይ ናቸው, እና ማንን እየመለመሉ ነው?

እና ምናልባትም በጣም የተሟላው የDeepSeek ታሪካዊ አጠቃላይ እይታ።

ባለፈው አመት በዚህ ጊዜ ከማጂክ ኩብ ኩዋንት የመጣ ጓደኛዬ ወደ እኔ መጣና “በቻይና ውስጥ ትልቅ ሞዴል መስራት ትፈልጋለህ?” ሲል ጠየቀኝ። እና በቀላሉ ከሰአት በኋላ ቡና እየጠጣሁ አሳለፍኩ። እንደተጠበቀው, ህይወት አሁንም በምርጫዎች ላይ የተመሰረተ ነው.

Magic Cube Quant እዚህ የተጠቀሰው ባለሀብቱ ነው።፣ ወይም የወላጅ ኩባንያ፣ የDeepSeek።

"ኳንት" ተብሎ የሚጠራው በሰው ኃይል ሳይሆን በአልጎሪዝም ውሳኔ የሚሰጥ የኢንቨስትመንት ተቋም ነው። የኳንት ፋንታሲ ምስረታ ረጅም አይደለም፣ እ.ኤ.አ. በ2015 ጀምሮ። በ2021፣ ስድስት አመት ሲሞላው፣ የኳንት ፋንታሲ የንብረት አስተዳደር ስኬል ከ100 ቢሊዮን በላይ ነበር፣ እና ከቻይና “አራት ታላላቅ የኳንት ነገስታት” አንዱ ተብሎ ተወድሷል።

የFantasy Square መስራች፣ ሊንግ ዌንፌንግ፣ እሱም የDeepSeek መስራች፣ እ.ኤ.አ. በ1980ዎቹ የተወለደ “ዋና ያልሆነ” የፋይናንሺያል መሪ ነው፡ የውጭ አገር የጥናት ልምድ የለውም፣ የኦሎምፒክ ውድድር አሸናፊ አይደለም፣ እና ከዜጂያንግ ዩኒቨርሲቲ የኤሌክትሮኒክስ ምህንድስና ትምህርት ክፍል በአርቴፊሻል ኢንተለጀንስ ተመረቀ። በየእለቱ "ወረቀቶችን በማንበብ, ኮድ በመጻፍ እና በቡድን ውይይቶች ውስጥ መሳተፍ" ዝቅተኛ ቁልፍ በሆነ መንገድ የሚሰራ የአገሬው የቴክኖሎጂ ባለሙያ ነው.

ሊያንግ ዌንፌንግ የባህላዊ የንግድ ሥራ ባለቤት ልማዶች የሉትም፣ ግን እንደ ንፁህ “የቴክኖሎጂ ባለሙያ” ነው።. ብዙ የኢንዱስትሪ የውስጥ ባለሙያዎች እና የ DeepSeek ተመራማሪዎች ለሊያንግ ዌንፌንግ እጅግ በጣም ጥሩ ውዳሴ ሰጥተውታል፡- “አንድ ሰው ጠንካራ የኢንፍራ ምህንድስና አቅም ያለው እና የሞዴል የምርምር ችሎታ ያለው፣ እንዲሁም ሃብትን የሚያንቀሳቅስ ሰው ነው፣” “ትክክለኛ ፍርድን ከከፍተኛ ደረጃ ሊሰጥ የሚችል፣ነገር ግን የላቀ ችሎታ ያለው ሰው። በግንባር ቀደምት ተመራማሪዎች ላይ በዝርዝር፣ እና እንዲሁም “አስፈሪ የመማር ችሎታ” አለው።

DeepSeek ከመመስረቱ ከረጅም ጊዜ በፊት ሁዋንፋንግ በ AI ኢንዱስትሪ ውስጥ የረጅም ጊዜ እቅድ ማውጣት ጀምሮ ነበር. እ.ኤ.አ. በግንቦት 2023 ሊያንግ ዌንፌንግ ከ Darksurge ጋር በተደረገ ቃለ ምልልስ ላይ “OpenAI GPT3 ን በ2020 ከለቀቀ በኋላ የ AI ልማት አቅጣጫ በጣም ግልፅ ሆኗል ፣ እና የኮምፒዩተር ሃይል ቁልፍ አካል ይሆናል ። ነገር ግን እ.ኤ.አ. በ2021 በፋየርፍሊ 2 ግንባታ ላይ ኢንቨስት ስናደርግ አብዛኛው ሰው አሁንም ሊረዳው አልቻለም።

በዚህ ፍርድ መሰረት ሁዋንፋንግ የራሱን የኮምፒውተር መሠረተ ልማት መገንባት ጀመረ። “ከመጀመሪያው 1 ካርድ፣ በ2015 እስከ 100 ካርዶች፣ በ2019 1,000 ካርዶች እና ከዚያም 10,000 ካርዶች፣ ይህ ሂደት ቀስ በቀስ ተከስቷል። ከጥቂት መቶ ካርዶች በፊት፣ በ IDC ውስጥ እንስተናግድ ነበር። ሚዛኑ ሲሰፋ ማስተናገጃው መስፈርቶቹን ማሟላት ስላልቻለ የራሳችንን የኮምፒውተር ክፍል መገንባት ጀመርን።

በኋላ ፋይናንስ ኢሌቨን “ከአምስት አይበልጡም። ከ10,000 በላይ ጂፒዩዎች ያሏቸው የሀገር ውስጥ ኩባንያዎች እና ከጥቂት ዋና ዋና አምራቾች በተጨማሪ Magic Cube የሚባል መጠናዊ ፈንድ ኩባንያን ያካትታሉ።” በማለት ተናግሯል። በአጠቃላይ ትላልቅ ሞዴሎችን ለማሰልጠን 10,000 Nvidia A100 ቺፕስ የኮምፒዩተር ሃይል ገደብ እንደሆነ ይታመናል.

ባለፈው ቃለ መጠይቅ ላይ ሊያንግ ዌንፌንግ አንድ አስደሳች ነጥብ ጠቅሷል፡- ብዙ ሰዎች ከጀርባው የማይታወቅ የንግድ ሥራ አመክንዮ አለ ብለው ያስባሉ፣ ግን በእውነቱ፣ በዋነኛነት በጉጉት የሚመራ ነው።

DeepSeekየመጀመሪያ ገጠመኝ

በግንቦት 2023 ከ Darksurge ጋር በተደረገ ቃለ ምልልስ፣ ሲጠየቅ "ከረጅም ጊዜ በፊት ሁዋንፋንግ ትልልቅ ሞዴሎችን ለመስራት መወሰኑን አስታውቋል፣ ለምንድነው የቁጥር ፈንድ እንደዚህ አይነት ነገር ያደርጋል?"

የሊንግ ዌንፌንግ መልስ በጣም አስደናቂ ነበር፡ “ትልቅ ሞዴል ለመገንባት ያደረግነው ውሳኔ ከቁጥር ወይም ከፋይናንስ ጋር ምንም ግንኙነት የለውም. ይህንን ለማድረግ DeepSeek የተባለ አዲስ ኩባንያ አቋቁመናል። በሚያንፋንግ ከሚገኙት የቡድኑ ቁልፍ አባላት መካከል ብዙዎቹ በአርቴፊሻል ኢንተለጀንስ ውስጥ ይሳተፋሉ። በዚያን ጊዜ፣ ብዙ ሁኔታዎችን ሞክረን በመጨረሻ በፋይናንስ ላይ ተስማማን፣ ይህም በቂ ውስብስብ ነው። አጠቃላይ አርቴፊሻል ኢንተለጀንስ ከቀጣዮቹ በጣም አስቸጋሪ ከሆኑ ጉዳዮች አንዱ ሊሆን ይችላል፣ስለዚህ ለኛ እንዴት ማድረግ እንዳለብን ሳይሆን ለምን እንደምናደርገው ጥያቄ ነው።

በንግድ ፍላጎቶች ወይም በገበያ አዝማሚያዎች ያልተመራ፣ ነገር ግን በቀላሉ የ AGI ቴክኖሎጂን በራሱ ለመፈተሽ ባለው ፍላጎት እና “በጣም አስፈላጊ እና ከባድ ነገር” ላይ ባለው የማያቋርጥ ማሳደድ ይመራ። “DeepSeek” የሚለው ስም በግንቦት 2023 በይፋ ተረጋግጧል. በጁላይ 17፣ 2023፣ “Hangzhou DeepSeek አርቲፊሻል ኢንተለጀንስ መሰረታዊ ቴክኖሎጂ ምርምር Co., Ltd።” ተካቷል ።

በርቷል እ.ኤ.አ. ኖቬምበር 2፣ 2023፣ DeepSeek የመጀመሪያውን መልሱን ሰጥቷል፡ DeepSeek Coder፣ ትልቅ የክፍት ምንጭ ኮድ ሞዴል. ይህ ሞዴል እንደ 1B፣ 7B እና 33B ያሉ በርካታ መጠኖችን ያካትታል። የክፍት ምንጭ ይዘቱ የመሠረት ሞዴል እና የትእዛዝ ማስተካከያ ሞዴልን ያካትታል።

በወቅቱ፣ ከክፍት ምንጭ ሞዴሎች መካከል፣ የሜታ ኮድላማ የኢንዱስትሪ መለኪያ ነበር። ነገር ግን፣ DeepSeek Coder አንዴ ከተለቀቀ፣ ከ CodeLlama ጋር ሲነጻጸር ባለ ብዙ ገፅታ መሪ ቦታ አሳይቷል፡ በኮድ ማመንጨት፣ HumanEval 9.3% ቀዳሚ ነበር፣ MBPP 10.8% ወደፊት፣ እና DS-1000 5.9% ቀዳሚ ነበር።

ያስታውሱ DeepSeek Coder 7B ሞዴል ሲሆን CodeLlama ደግሞ 34B ሞዴል ነው። በተጨማሪም, የ DeepSeek Coder ሞዴል, በመመሪያው ከተስተካከለ በኋላ, GPT3.5-Turboን በአጠቃላይ አልፏል.

ኮድ ማመንጨት አስደናቂ ብቻ ሳይሆን DeepSeek Coder ጡንቻዎቹን በሂሳብ እና በምክንያት ያሳያል።

ከሶስት ቀናት በኋላ፣ እ.ኤ.አ. ህዳር 5፣ 2023፣ DeepSeek እንደ AGI ትልቅ ሞዴል ተለማማጅ፣ የመረጃ ባለሙያ፣ የመረጃ አርክቴክቸር ተሰጥኦ፣ ከፍተኛ የመረጃ አሰባሰብ መሀንዲስ፣ ጥልቅ ትምህርት ጥናትና ምርምር እና ልማት ያሉ የስራ መደቦችን ጨምሮ በWeChat የህዝብ መለያ በኩል ከፍተኛ መጠን ያለው የምልመላ ይዘትን ለቋል። ኢንጂነር, ወዘተ, እና ቡድኑን በንቃት ማስፋፋት ጀመረ.

ሊያንግ ዌንፌንግ እንዳለው፣ DeepSeek ለችሎታ ቅጥር “ሊኖራቸው የሚገቡ መስፈርቶች” “ፍቅር እና ጠንካራ መሰረታዊ ችሎታዎች” ናቸው።, እና ያንን አጽንዖት ሰጥቷል ሁሉም ሰው ስህተት የመሥራት እና አዳዲስ ነገሮችን የመሞከር ነፃነት እንዲኖረው ፈጠራ በተቻለ መጠን ትንሽ ጣልቃ ገብነት እና አስተዳደር ይጠይቃል። ፈጠራ ብዙውን ጊዜ የሚመጣው ከውስጥ ነው እንጂ ሆን ተብሎ በተዘጋጀ ዝግጅት አይደለም፣ እና በእርግጠኝነት በማስተማር አይመጣም።

ሞዴሎች በተደጋጋሚ ይለቀቃሉ, እና ክፍት ምንጭ ይለማመዳል

DeepSeek Coder ብልጭታ ካደረገ በኋላ DeepSeek ትኩረቱን ወደ ዋናው የጦር ሜዳ አዞረ፡ አጠቃላይ የቋንቋ ሞዴሎች።

በርቷል እ.ኤ.አ. ኖቬምበር 29፣ 2023፣ DeepSeek የመጀመሪያውን አጠቃላይ-ዓላማ ትልቅ የቋንቋ ሞዴል DeepSeek LLM 67B አወጣ። ይህ ሞዴል ከሜታ LLMA2 70B ሞዴል ጋር ተመሳሳይ ደረጃ ያለው ሲሆን በቻይንኛ እና እንግሊዝኛ ወደ 20 በሚጠጉ የህዝብ ግምገማ ዝርዝሮች ውስጥ የተሻለ አፈጻጸም አሳይቷል። በተለይም የማመዛዘን፣ የሂሳብ እና የፕሮግራም ችሎታዎች (ለምሳሌ፣ HumanEval፣ MATH፣ CEval እና CMMLU) ግሩም ናቸው።

DeepSeek LLM 67B ክፍት ምንጭ መንገድን መርጧል እና የንግድ አጠቃቀምን ይደግፋል። ምንጩን ለመክፈት ያለውን ቅንነት እና ቁርጠኝነት የበለጠ ለማሳየት DeepSeek ከዚህ ቀደም ታይቶ በማይታወቅ ሁኔታ ሁለት የተለያዩ ሚዛኖች ሞዴሎችን 7B እና 67B በአንድ ጊዜ ከፍቷል፣እንዲያውም በአብነት ስልጠና ሂደት ለተመራማሪዎች እንዲወርዱ እና እንዲጠቀሙባቸው የተፈጠሩትን ዘጠኝ ኬላዎች ይፋ አድርጓል። “ሁሉንም ነገር ከማስተማር” ጋር የሚመሳሰል ይህ ዓይነቱ ክዋኔ በመላው ክፍት ምንጭ ማህበረሰብ ውስጥ እጅግ በጣም አልፎ አልፎ ነው።

የDeepSeek LLM 67Bን ትክክለኛ አቅም በበለጠ እና በተጨባጭ ለመገምገም፣የDeepSeek የምርምር ቡድን ለ"ውጥረት መፈተሻ" ተከታታይ "አዲስ ጥያቄዎችን" በጥንቃቄ ቀርጿል። እነዚህ ጥያቄዎች እንደ የሃንጋሪ ሁለተኛ ደረጃ ሒሳብ ፈተና ጥያቄዎች፣ የግምገማ ስብስቦችን ተከትሎ የGoogle ትዕዛዝ እና የLeetCode ሳምንታዊ የውድድር ጥያቄዎችን የመሳሰሉ የከፍተኛ ደረጃ፣ ከፍተኛ አድሎአዊ ፈተናዎችን ይሸፍናሉ። የፈተና ውጤቶቹ አበረታች ነበሩ። DeepSeek LLM 67B ከናሙናው በላይ ያለውን አጠቃላይ የማጠቃለል ችሎታው አስደናቂ አቅም አሳይቷል፣ እና አጠቃላይ አፈፃፀሙ በወቅቱ እጅግ የላቀ ከነበረው GPT-4 ሞዴል ጋር እንኳን የቀረበ ነበር።

በርቷል ዲሴምበር 18፣ 2023፣ DeepSeek የVincent 3D ሞዴል DreamCraft3D ምንጭን ከፈተ።ከፍተኛ ጥራት ያላቸውን 3D ሞዴሎችን ከአረፍተ ነገር ማመንጨት ይችላል፣ ይህም ከ2D አውሮፕላኖች ወደ 3D ቦታ በ AIGC ውስጥ ያለውን ዝላይ ማሳካት ይችላል። ለምሳሌ፣ ተጠቃሚው ግብዓት ቢያደርግ፡- “በጫካ ውስጥ መሮጥ፣ የአሳማ ጭንቅላት እና የጦጣ ንጉስ አካል አስቂኝ ድብልቅ ምስል” DreamCraft3D ከፍተኛ ጥራት ያለው ይዘትን ሊያወጣ ይችላል።

በመርህ ደረጃ፣ ሞዴሉ መጀመሪያ የቬን ዲያግራምን ያጠናቅቃል፣ ከዚያም በ2D ፅንሰ-ሃሳብ ካርታ ላይ የተመሰረተውን አጠቃላይ የጂኦሜትሪክ መዋቅር ጨምሯል።

ከዚያ በኋላ በተደረገው ተጨባጭ ግምገማ፣ ከ901TP11ቲ በላይ ተጠቃሚዎች DreamCraft3D ከቀደምት ትውልድ ዘዴዎች ጋር ሲነፃፀሩ በትውልድ ጥራት ያለው ጥቅም እንዳለው ተናግረዋል።

በጃንዋሪ 7፣ 2024፣ DeepSeek የDeepSeek LLM 67B ቴክኒካዊ ሪፖርት አወጣ። ይህ ባለ 40+ ገጽ ሪፖርት ብዙ የDeepSeek LLM 67B ዝርዝሮችን ይዟል፣ እራስ-የተገነቡ የስኬል ህጎችን፣ የሞዴል አሰላለፍ ሙሉ ተግባራዊ ዝርዝሮችን እና አጠቃላይ የAGI ችሎታ ግምገማ ስርዓትን ጨምሮ።

የወረቀት አድራሻ

በርቷል ጃንዋሪ 11፣ 2024፣ DeepSeek በቻይና ውስጥ የመጀመሪያውን MoE (የተደባለቀ ኤክስፐርት አርኪቴክቸር) ትልቅ ሞዴል DeepSeekMoE፡ ቻይንኛ እና እንግሊዘኛን የሚደግፍ እና ለንግድ አገልግሎት ነፃ የሆነ አዲስ አርክቴክቸር በተከፈተ ምንጭ ቀረበ። የMoE አርክቴክቸር በአጠቃላይ ለOpenAI GPT-4 የአፈጻጸም ግኝት ቁልፍ ተደርጎ ይወሰድ ነበር። የDeepSeek በራሱ ያደገው የሞኢ አርክቴክቸር እንደ 2B፣ 16B፣ እና 145B ባሉ በርካታ ሚዛኖች እየመራ ነው፣ እና ስሌቱ ደግሞ በጣም የሚያስመሰግን ነው።

በጃንዋሪ 25፣ 2024፣ DeepSeek የDeepSeek Coder ቴክኒካል ዘገባን አወጣ። ይህ ሪፖርት የሥልጠና መረጃ፣ የሥልጠና ዘዴዎች እና የሞዴል አፈጻጸም አጠቃላይ ቴክኒካል ትንተና ይሰጣል። በዚህ ዘገባ ውስጥ ለመጀመሪያ ጊዜ የመጋዘን ደረጃ ኮድ መረጃን ገንብቶ በፋይሎች መካከል ያለውን ጥገኝነት ለመተንተን ቶፖሎጂካል አከፋፈልን በመጠቀም የረዥም ርቀት ተሻጋሪ ፋይሎችን የመረዳት አቅምን በእጅጉ ያሳደገ መሆኑን ማየት እንችላለን። የስልጠና ዘዴዎችን በተመለከተ, የመሙላት-መካከለኛ ዘዴ ተጨምሯል, ይህም የኮድ ማጠናቀቅ ችሎታን በእጅጉ አሻሽሏል.

የወረቀት አድራሻ

በጃንዋሪ 30፣ 2024፣ DeepSeek ክፍት መድረክ በይፋ ተጀመረ፣ እና DeepSeek Large Model API አገልግሎት መሞከር ጀመረ። 10 ሚሊዮን ቶከኖች በነጻ ለማግኘት ይመዝገቡ። በይነገጹ ከOpenAI API በይነገጽ ጋር ተኳሃኝ ነው፣ እና ሁለቱም የቻት/ኮደር ድርብ ሞዴሎች አሉ። በዚህ ጊዜ DeepSeek ከቴክኖሎጂ ምርምር እና ልማት በተጨማሪ የቴክኖሎጂ አገልግሎት ሰጪን መንገድ መመርመር ጀመረ.

በርቷል እ.ኤ.አ. ፌብሩዋሪ 5፣ 2024፣ DeepSeek ሌላ ቀጥ ያለ የጎራ ሞዴል DeepSeekMath አወጣ።, የሂሳብ ማመዛዘን ሞዴል. ይህ ሞዴል 7 ቢ መለኪያዎች ብቻ ነው ያለው, ነገር ግን የሂሳብ የማመዛዘን ችሎታው ከ GPT-4 ጋር ቅርብ ነው. በባለስልጣኑ የሒሳብ ቤንችማርክ ዝርዝር ውስጥ፣ ህዝቡን በልጦ በ30B እና 70B መካከል ያሉ የመለኪያ መጠኖች ያላቸውን በርካታ የክፍት ምንጭ ሞዴሎችን በልጧል። የ DeepSeekMath መለቀቅ የ DeepSeek ቴክኒካዊ ጥንካሬን እና በአቀባዊ ምርምር እና ልማት ውስጥ እና በአምሳያ ምርምር እና ልማት ውስጥ ወደፊት የሚመስለውን አቀማመጥ ሙሉ በሙሉ ያሳያል።

በርቷል እ.ኤ.አ. ፌብሩዋሪ 28፣ 2024፣ ገንቢዎች DeepSeek ክፍት ምንጭ ሞዴሎችን ስለመጠቀም ያላቸውን ስጋት የበለጠ ለማቃለል DeepSeek ክፍት ምንጭ ፖሊሲ ተደጋጋሚ ጥያቄዎችን አውጥቷል።እንደ ሞዴል ክፍት ምንጭ ፈቃድ እና የንግድ አጠቃቀም ገደቦች ላሉ ተደጋግሞ ለሚነሱ ጥያቄዎች ዝርዝር መልሶችን ይሰጣል። DeepSeek ክፍት ምንጭን በበለጠ ግልጽ እና ክፍት አመለካከትን ይቀበላል፡-

በርቷል ማርች 11፣ 2024፣ DeepSeek የመልቲ ሞዳል ትልቅ ሞዴል DeepSeek-VL አወጣ።. ይህ የDeepSeek የመልቲ-ሞዳል AI ቴክኖሎጂ የመጀመሪያ ሙከራ ነው። ሞዴሉ 7B እና 1.3B መጠን ያለው ሲሆን ሞዴሉ እና ቴክኒካል ወረቀቶች በአንድ ጊዜ ክፍት ናቸው።

በርቷል ማርች 20፣ 2024፣ ሁዋንፋንግ AI እና DeepSeek በNVDIA GTC 2024 ኮንፈረንስ ላይ እንዲሳተፉ በድጋሚ ተጋብዘዋል፣ እና መስራች ሊያንግ ዌንፌንግ የቴክኒክ ቁልፍ ንግግር አቀረበ። "በዲይቨርሲቲ ውስጥ ስምምነት: የትልቅ ቋንቋ ሞዴሎች እሴቶችን ማመጣጠን እና መፍታት" በሚል ርዕስ. እንደ “ነጠላ እሴት ትልቅ ሞዴል እና ብዙሃነት ባለው ማህበረሰብ እና ባህል መካከል ያለው ግጭት”፣ “ትልቅ የሞዴል እሴት አሰላለፍ መፍታት” እና “የተለያዩ የእሴት አሰላለፍ ሁለገብ ተግዳሮቶች” በመሳሰሉት ጉዳዮች ላይ ተብራርቷል። ይህ የሚያሳየው የDeepSeek ሰብአዊ ክብካቤ እና ማህበራዊ ሃላፊነት ለ AI ልማት፣ ከቴክኖሎጂ ጥናትና ምርምር በተጨማሪ።

በማርች 2024 እ.ኤ.አ. DeepSeek ኤፒአይ በቻይና ትልቅ ሞዴል ገበያ ውስጥ ለዋጋ ጦርነት ቅድመ ሁኔታን ሙሉ በሙሉ ያቀጣጠለው የሚከፈልባቸው አገልግሎቶች በይፋ ተጀምረዋል፡ 1 ዩዋን በአንድ ሚሊዮን የግብዓት ቶከኖች እና 2 ዩዋን በሚሊየን የውጤት ማስመሰያዎች።

እ.ኤ.አ. በ 2024 ፣ DeepSeek በቻይና ውስጥ የትላልቅ ሞዴሎችን መዝገብ በተሳካ ሁኔታ አልፏል ፣ ይህም የኤፒአይ አገልግሎቶችን ሙሉ በሙሉ ለመክፈት የፖሊሲ እንቅፋቶችን በማጽዳት ነው።

በግንቦት 2024፣ DeepSeek-V2፣ ክፍት ምንጭ አጠቃላይ የMoE ትልቅ ሞዴል ተለቀቀ እና የዋጋ ጦርነት በይፋ ተጀመረ። DeepSeek-V2 ኤምኤልኤ (ባለብዙ ጭንቅላት ድብቅ ትኩረት ዘዴ) ይጠቀማል፣ ይህም የአምሳያው የማስታወሻ አሻራ ወደ 5%-13% ከባህላዊ MHA ይቀንሳል። በተመሳሳይ ጊዜ የDeepSeek MoE Sparse sparse መዋቅርን ለብቻው አዘጋጅቷል፣ ይህም የአምሳያው ስሌት ውስብስብነት በእጅጉ ይቀንሳል። ለዚህም ምስጋና ይግባውና ሞዴሉ የኤፒአይ ዋጋን "1 ዩዋን / ሚሊዮን ግብዓቶች እና 2 ዩዋን / ሚሊዮን ውጤቶች" ይይዛል.

DeepSeek ከፍተኛ ተጽዕኖ አሳድሯል. በዚህ ረገድ የሴሚአናሊስት መሪ ተንታኝ DeepSeek V2 ወረቀት "በዚህ አመት ከምርጦቹ ውስጥ አንዱ ሊሆን ይችላል" ብለው ያምናሉ. በተመሳሳይም, አንድሪው ካር, የቀድሞ የ OpenAI ሰራተኛ, ወረቀቱ "በአስደናቂ ጥበብ የተሞላ" እና የስልጠና ቅንጅቶችን በእራሱ ሞዴል ላይ እንደተጠቀመ ያምናል.

ይህ GPT-4-Turboን የሚያረጋግጥ ሞዴል መሆኑን እና የኤፒአይ ዋጋው ከኋለኛው 1/70 ብቻ መሆኑን ልብ ሊባል ይገባል።

ሰኔ ላይ እ.ኤ.አ. 17፣ 2024፣ DeepSeek የDeepSeek Coder V2 ኮድ ሞዴልን በመልቀቅ እንደገና ትልቅ ግፊት አድርጓል። የክፍት ምንጭ እና የኮድ አቅሞች በወቅቱ እጅግ የላቀ የተዘጋ ምንጭ ሞዴል ከ GPT-4-Turbo በልጠዋል። DeepSeek Coder V2 የDeepSeek ወጥ የሆነ የክፍት ምንጭ ስትራቴጂን ይቀጥላል፣ ሁሉም ሞዴሎች፣ ኮድ እና ወረቀቶች ክፍት ምንጭ ያላቸው፣ እና ሁለት ስሪቶች 236B እና 16B፣ ቀርቧል። DeepSeek C oder V2's API አገልግሎቶችም በመስመር ላይ ይገኛሉ፣ እና ዋጋው በ"1 ዩዋን/ሚሊየን ግብአት እና 2 ዩዋን/ሚሊየን ውፅዓት" ይቀራል።

በርቷል ሰኔ 21፣ 2024፣ DeepSeek ኮደር የመስመር ላይ ኮድ አፈጻጸምን ይደግፋል። በዚያው ቀን, Claude3.5 Sonnet ተለቀቀ, በአዲሱ አርቲፊክስ ባህሪ, በራስ-ሰር ኮድ ያመነጫል እና በአሳሹ ውስጥ በቀጥታ ይሰራል. በተመሳሳይ ቀን በ DeepSeek ድህረ ገጽ ላይ ያለው ኮድ ረዳት እንዲሁ ተመሳሳይ ባህሪን ጀምሯል-ኮድ ይፍጠሩ እና በአንድ ጠቅታ ያሂዱ።

የዚህን ጊዜ ዋና ዋና ክስተቶችን እንከልስ፡-

ቀጣይነት ያለው ግኝቶች, ዓለም አቀፋዊ ትኩረትን ይስባል

በግንቦት 2024፣ DeepSeek በMoE ላይ የተመሰረተ ክፍት ምንጭ ሞዴል DeepSeek V2 በመልቀቅ በአንድ ጀንበር ታዋቂ ሆነ። ከ GPT-4-Turbo አፈጻጸም ጋር ተመሳስሏል፣ ነገር ግን በ1 yuan/ሚሊዮን ግብዓት ዋጋ ብቻ፣ ይህም የጂፒቲ-4-ቱርቦ 1/70 ነበር። በዚያን ጊዜ፣ DeepSeek በኢንዱስትሪው ውስጥ የታወቀ “የዋጋ ሥጋ ሥጋ” ሆነ፣ ከዚያም እንደ ዚቼንግ፣ ባይትዳንስ፣ እና አሊባባ ያሉ ዋና ተዋናዮች… እና ሌሎች ዋና ተዋናዮች በፍጥነት ተከትለው ዋጋቸውን አነሱ። ሌላ ዙር የጂፒቲ እገዳ የነበረበትም በዚያን ጊዜ አካባቢ ነበር፣ እና ብዙ ቁጥር ያላቸው AI መተግበሪያዎች ለመጀመሪያ ጊዜ የቤት ውስጥ ሞዴሎችን መሞከር ጀመሩ።

በጁላይ 2024፣ የDeepSeek መስራች ሊያንግ ዌንፌንግ ከጨለማ ሱርጅ ጋር የተደረገውን ቃለ ምልልስ በድጋሚ ተቀብሎ ለዋጋ ጦርነት በቀጥታ ምላሽ ሰጠ፡- "በጣም ያልተጠበቀ። ዋጋው ሁሉንም ሰው በጣም ስሜታዊ ያደርገዋል ብዬ አልጠበኩም ነበር። ነገሮችን በራሳችን ፍጥነት እና ከዚያም ዋጋን በዋጋ እንሰራለን። የእኛ መርህ ገንዘብ ማጣት ወይም የተጋነነ ትርፍ ማግኘት አይደለም። ይህ ዋጋ ከትንሽ ትርፍ ጋር በትንሹ ከወጪ በላይ ነው።

ከኪሳቸው አውጥተው ድጎማ ከሚያደርጉት ተወዳዳሪዎች በተለየ DeepSeek በዚህ ዋጋ ትርፋማ እንደሆነ ማየት ይቻላል።

አንዳንድ ሰዎች እንዲህ ሊሉ ይችላሉ፡ የዋጋ ቅነሳ ተጠቃሚዎችን እንደ መዝረፍ ነው፡ ይህ ደግሞ በበይነመረብ ዘመን በዋጋ ጦርነቶች ውስጥ ብዙውን ጊዜ ይከሰታል

በምላሹ ሊያንግ ዌንፌንግ እንዲሁ ምላሽ ሰጥቷል፡- "ተጠቃሚዎችን መዝረፍ ዋና ግባችን አይደለም። ዋጋውን ዝቅ አድርገናል ምክንያቱም በአንድ በኩል የሚቀጥለውን ትውልድ ሞዴል አወቃቀር ስንመረምር ዋጋው ቀንሷል እና በሌላ በኩል ኤፒአይ እና AI ሁለቱም ተመጣጣኝ እና ለሁሉም ሰው ተደራሽ መሆን አለባቸው ብለን እናስባለን ። ”

ስለዚህ ታሪኩ በሊያንግ ዌንፌንግ ሃሳባዊነት ይቀጥላል።

በጁላይ 4፣ 2024፣ DeepSeek API መስመር ላይ ወጣ። የ128ሺህ አውድ ዋጋ አልተለወጠም። የአንድ ሞዴል ዋጋ ዋጋ ከዐውደ-ጽሑፉ ርዝመት ጋር በቅርበት የተያያዘ ነው. ስለዚህ, ብዙ ሞዴሎች በዚህ ርዝመት ላይ ጥብቅ ገደቦች አሏቸው-የ GPT-3.5 የመጀመሪያ ስሪት 4k አውድ ብቻ ነው ያለው.

በዚህ ጊዜ፣ DeepSeek የአውድ ርዝመቱን ካለፈው 32k ወደ 128k ጨምሯል።

በርቷል እ.ኤ.አ. ጁላይ 10 ፣ 2024 ፣ የአለም የመጀመሪያው AI ኦሊምፒያድ (ኤአይኤምኦ) ውጤት ይፋ ሆነ ፣ እና DeepSeekMath ሞዴል የከፍተኛ ቡድኖች የተለመደ ምርጫ ሆነ።. አሸናፊዎቹ ምርጥ 4 ቡድኖች ሁሉም ለመግቢያ ሞዴላቸው DeepSeekMath-7B መርጠው በውድድሩ አስደናቂ ውጤት አስመዝግበዋል።

በርቷል እ.ኤ.አ. ጁላይ 18፣ 2024፣ DeepSeek-V2 በቻትቦት አሬና ላይ የክፍት ምንጭ ሞዴሎችን ዝርዝር ቀዳሚ ሆነ። እንደ Llama3-70B፣ Qwen2-72B፣ Nemotron-4-340B፣ እና Gemma2-27B ያሉ የኮከብ ሞዴሎች ብልጫ ያለው እና ለክፍት ምንጭ ትልልቅ ሞዴሎች አዲስ መለኪያ መሆን።

ውስጥ ጁላይ 2024፣ DeepSeek ተሰጥኦዎችን መቅጠሩን ቀጥሏል። እና ለወደፊት የቴክኖሎጂ ፈጠራ እና የምርት ልማት ለማዘጋጀት AI ስልተ ቀመሮችን፣ AI Infra፣ AI Tutor እና AI ምርቶችን ጨምሮ በተለያዩ ዘርፎች ከአለም ዙሪያ ከፍተኛ ተሰጥኦዎችን ቀጥሯል።

በርቷል ጁላይ 26፣ 2024፣ DeepSeek ኤፒአይ ጠቃሚ ማሻሻያ አስገብቷል፣ እንደ መፃፍ፣ FIM (ሙላ-በመካከለኛው) ማጠናቀቅ፣ የተግባር ጥሪ እና የJSON ውፅዓት ያሉ ተከታታይ የላቁ ባህሪያትን ሙሉ በሙሉ ይደግፋል። የ FIM ተግባር በጣም አስደሳች ነው-ተጠቃሚው መጀመሪያ እና መጨረሻ ይሰጣል, እና ትልቁ ሞዴል በመሃል ላይ ይሞላል, ይህም ለፕሮግራም አወጣጥ ሂደቱ ትክክለኛውን የተግባር ኮድ ለመሙላት በጣም ተስማሚ ነው. የፊቦናቺን ቅደም ተከተል መፃፍ እንደ ምሳሌ እንውሰድ፡-

በርቷል ኦገስት 2፣ 2024፣ DeepSeek የሃርድ ዲስክ መሸጎጫ ቴክኖሎጂን በፈጠራ አስተዋወቀ፣ የኤፒአይ ዋጋን ወደ ቁርጭምጭሚት በመቀነስ። ከዚህ ቀደም የኤፒአይ ዋጋዎች በአንድ ሚሊዮን ቶከኖች ¥1 ብቻ ነበሩ። አሁን ግን፣ አንዴ መሸጎጫ ከተሰራ፣ የኤፒአይ ክፍያ በቀጥታ ወደ ¥0.1 ይወርዳል።

ይህ ባህሪ የማያቋርጥ ውይይቶች እና የቡድን ማቀነባበሪያ ስራዎች ሲሳተፉ በጣም ተግባራዊ ይሆናል.

በርቷል እ.ኤ.አ. ኦገስት 16፣ 2024፣ DeepSeek ሞዴሉን የሚያረጋግጥ የሂሳብ ቲዎሬም አወጣ DeepSeek-Prover-V1.5 እንደ ክፍት ምንጭ፣ በሁለተኛ ደረጃ እና በኮሌጅ የሂሳብ ቲዎሬም ፈተናዎች ውስጥ ከብዙ ታዋቂ የክፍት ምንጭ ሞዴሎች በልጦ ነበር።

በርቷል ሴፕቴምበር 6፣ 2024፣ DeepSeek የDeepSeek-V2.5 ውህደት ሞዴልን ለቋል። ከዚህ ቀደም DeepSeek በዋናነት ሁለት ሞዴሎችን አቅርቧል፡ የቻት ሞዴል በአጠቃላይ የውይይት ክህሎት ላይ ያተኮረ ሲሆን የኮድ ሞዴል ደግሞ በኮድ አቀናባሪ ላይ ያተኮረ ነበር። በዚህ ጊዜ, ሁለቱ ሞዴሎች ወደ አንድ ተጣምረው ወደ DeepSeek-V2.5 ተሻሽለዋል, ይህም ከሰዎች ምርጫዎች ጋር በተሻለ ሁኔታ የሚጣጣም እና እንዲሁም በአጻጻፍ ተግባራት, በትዕዛዝ እና ሌሎች ገጽታዎች ላይ ከፍተኛ መሻሻሎችን አሳይቷል.

በርቷል ሴፕቴምበር 18፣ 2024፣ DeepSeek-V2.5 የአገር ውስጥ ሞዴሎችን እየመራ በአዲሱ የLMSYS ዝርዝር ውስጥ እንደገና ነበር እና አዲስ ምርጥ ውጤቶችን ለሀገር ውስጥ ሞዴሎች በበርካታ የግለሰብ ችሎታዎች ማዘጋጀት.

በርቷል ኖቬምበር 20፣ 2024፣ DeepSeek DeepSeek-R1-Lite ተለቀቀ በኦፊሴላዊው ድር ጣቢያ ላይ. ይህ ከo1-ቅድመ እይታ ጋር የሚወዳደር የኢንፈረንስ ሞዴል ነው፣ እና ለV3 ድህረ-ስልጠና በቂ የሆነ ሰው ሰራሽ ዳታ ይሰጣል።

በርቷል ዲሴምበር 10፣ 2024፣ DeepSeek V2 ተከታታዮች የመጨረሻውን በጥሩ ሁኔታ የተስተካከለ የDeepSeek-V2.5-1210 ስሪት መለቀቅን አስከትሏል። ይህ እትም በድህረ-ስልጠና በኩል የሂሳብ፣የመፃፍ፣የመፃፍ እና ሚና-መጫወትን ጨምሮ በርካታ ችሎታዎችን ባጠቃላይ ያሻሽላል።

ይህ ስሪት ሲመጣ፣ የDeepSeek ድር መተግበሪያ የአውታረ መረብ ፍለጋ ተግባሩን ከፍቷል።

በርቷል እ.ኤ.አ. ዲሴምበር 13፣ 2024፣ DeepSeek በመልቲ ሞዳሊቲ መስክ ሌላ እመርታ አድርጓል እና የክፍት ምንጭ መልቲሞዳል ትልቅ ሞዴል DeepSeek-VL2ን ለቋል። DeepSeek-VL2 የMoE አርክቴክቸርን ተቀብሏል፣ይህም የማየት አቅሙን በእጅጉ ያሻሽላል። በሶስት መጠኖች ይገኛል፡ 3B፣ 16B እና 27B፣ እና በሁሉም መለኪያዎች ውስጥ ጥቅም አለው።

በርቷል ዲሴምበር 26፣ 2024፣ DeepSeek-V3 በክፍት ምንጭ ተለቀቀ፡ የስልጠናው ወጪ 5.5 ሚሊዮን ዶላር ብቻ ነበር። DeepSeek-V3 በባህር ማዶ የተዘጉ የምንጭ ሞዴሎችን አፈፃፀም ሙሉ በሙሉ መለካት እና የትውልዱን ፍጥነት በእጅጉ አሻሽሏል።

የኤፒአይ አገልግሎቶች ዋጋ ተስተካክሏል፣ ግን በተመሳሳይ ጊዜ፣ ለአዲሱ ሞዴል የ45-ቀናት ተመራጭ የሙከራ ጊዜ ተቀምጧል።

በጃንዋሪ 15፣ 2025፣ ይፋዊው DeepSeek መተግበሪያ በይፋ ተለቀቀ እና በዋና ዋና የiOS/አንድሮይድ መተግበሪያ ገበያዎች ላይ ተጀመረ።

በጃንዋሪ 20፣ 2025፣ ለቻይና አዲስ አመት ሲቃረብ፣ የDeepSeek-R1 ኢንፈረንስ ሞዴል በይፋ ተለቀቀ እና ክፍት ነው። DeepSeek-R1 አፈፃፀሙን ከኦፊሴላዊው የOpenAI o1 ልቀት ጋር ሙሉ በሙሉ አስተካክሎ የሃሳብ ሰንሰለት ውፅዓት ተግባርን ከፍቷል። በተመሳሳይ ጊዜ DeepSeek የሞዴሉ ክፍት ምንጭ ፍቃድ ወደ MIT ፍቃድ እንደሚቀየር እና የተጠቃሚ ስምምነቱ በግልጽ "ሞዴል ማረም" ክፍት ምንጭን በመቀበል እና የቴክኖሎጂ መጋራትን እንደሚያበረታታ አስታውቋል።

በኋላ, ይህ ሞዴል በጣም ተወዳጅ እና ወደ አዲስ ዘመን መጣ

በዚህ ምክንያት ከጃንዋሪ 27 ቀን 2025 ጀምሮ DeepSeek መተግበሪያ ChatGPTን በተሳካ ሁኔታ በማለፍ በዩኤስ አይኦኤስ አፕ ስቶር የነጻ መተግበሪያ ማውረድ ዝርዝርን ቀዳሚ ሆኗል፣ ይህም ድንቅ AI መተግበሪያ ሆኗል።

ጃንዋሪ 27፣ 2025፣ በአዲስ አመት ዋዜማ ከጠዋቱ 1፡00 ላይ፣ DeepSeek Janus-Pro እንደ ክፍት ምንጭ ተለቋል። ይህ በጥንታዊ የሮማውያን አፈ ታሪክ ውስጥ ባለ ሁለት ፊት አምላክ በያኑስ ስም የተሰየመ መልቲሞዳል ሞዴል ነው፡ ያለፈውን እና የወደፊቱን ይመለከታል። ይህ ደግሞ የአምሳያው ሁለቱን ችሎታዎች ይወክላል-የእይታ ግንዛቤ እና ምስል ማመንጨት እና የበርካታ ደረጃዎች የበላይነት።

የ DeepSeek ፈንጂ ታዋቂነት ወዲያው ዓለም አቀፋዊ የቴክኖሎጂ አስደንጋጭ ማዕበልን አስነስቷል፣እንዲያውም በቀጥታ የNVDIA የአክሲዮን ዋጋ 18% እንዲቀንስ እና የአለም የቴክኖሎጂ ስቶክ ገበያ ዋጋ በ1 ትሪሊየን ዶላር አካባቢ እንዲተን አድርጓል። የዎል ስትሪት እና የቴክኖሎጅ ሚዲያዎች የDeepSeek እድገት የአለም አቀፉን የኤአይ ኢንደስትሪ መልክአ ምድር እየገለባበጡ እና ለአሜሪካ የቴክኖሎጂ ግዙፍ ኩባንያዎች ከዚህ ቀደም ታይቶ የማይታወቅ ፈተና እየፈጠረ ነው ሲሉ ተደምጠዋል።

የDeepSeek ስኬት ከፍተኛ አለም አቀፍ ትኩረትን እና ስለቻይና AI የቴክኖሎጂ ፈጠራ ችሎታዎች ሞቅ ያለ ውይይቶችን አስነስቷል። የዩኤስ ፕሬዝዳንት ዶናልድ ትራምፕ የDeepSeek እድገትን “አዎንታዊ” ሲሉ አድንቀው ለዩናይትድ ስቴትስ “የማንቂያ ደወል” ነው ብለዋል። የማይክሮሶፍት ዋና ስራ አስፈፃሚ ሳቲያ ናዴላ እና የ OpenAI ዋና ስራ አስፈፃሚ ሳም አልትማን DeepSeekን አወድሰውታል፣ ቴክኖሎጂውን “በጣም አስደናቂ” ብለውታል።

እርግጥ ነው፣ ውዳሴያቸው በከፊል የDeepSeek ጥንካሬ እውቅና እና ከፊል የራሳቸው ዓላማ ነጸብራቅ መሆኑን መረዳት አለብን። ለምሳሌ አንትሮፖኒክ የDeepSeek ስኬቶችን ቢያውቅም የአሜሪካ መንግስት በቻይና ላይ የሚደረገውን የቺፕ ቁጥጥር እንዲያጠናክርም እየጠየቀ ነው።

አንትሮፖኒክ ዋና ሥራ አስፈፃሚ ባለ 10,000 ቃላትን ያትማል፡ የDeepSeek መነሳት ማለት ዋይት ሀውስ ቁጥጥሮችን ማጠናከር አለበት ማለት ነው።

ማጠቃለያ እና እይታ

DeepSeek ያለፉትን ሁለት ዓመታት መለስ ብለን ስንመለከት፣ በእርግጥም “የቻይና ተአምር” ነው፤ ከማይታወቅ ጅምር እስከ “ምስጢራዊው የምስራቃዊ ኃይል” አሁን በዓለም አቀፉ AI መድረክ ላይ እያበራ ያለው፣ DeepSeek አንድ “የማይቻል”ን በሌላ በኋላ ጽፏል። ጥንካሬ እና ፈጠራ.

የዚህ የቴክኖሎጂ ጉዞ ጥልቅ ትርጉም ከረጅም ጊዜ በፊት የንግድ ውድድር ወሰን አልፏል. DeepSeek ከእውነታዎች ጋር አስታውቋል የወደፊቱን በሚመለከት በሰው ሰራሽ የማሰብ ችሎታ ስልታዊ መስክ ውስጥ የቻይና ኩባንያዎች ሙሉ በሙሉ ወደ ዋናው የቴክኖሎጂ ከፍታ የመውጣት ችሎታ አላቸው።

በትራምፕ የተነገረው “የማንቂያ ደወል” እና የአንትሮፖዚክ ድብቅ ፍርሃት የቻይናን AI ችሎታዎች አስፈላጊነት በትክክል ያረጋግጣሉ፡ ማዕበሉን ማሽከርከር ብቻ ሳይሆን የማዕበሉን አቅጣጫ እየቀየረ ነው።

ጥልቅ ፍለጋ ምርት መልቀቅ ወሳኝ ደረጃዎች

  • ኖቬምበር 2፣ 2023፡- DeepSeek Coder ትልቅ ሞዴል
  • ህዳር 29፣ 2023፡- DeepSeek LLM 67B ሁለንተናዊ ሞዴል
  • ዲሴምበር 18፣ 2023፡- DreamCraft3D 3D ሞዴል
  • ጃንዋሪ 11፣ 2024፡- DeepSeekMoE MOE ትልቅ ሞዴል
  • ፌብሩዋሪ 5፣ 2024፡- DeepSeekMአት የሂሳብ ማመዛዘን ሞዴል
  • ማርች 11፣ 2024፡- DeepSeek-VL መልቲሞዳል ትልቅ ሞዴል
  • ግንቦት 2024፡- DeepSeek-V2 MOE አጠቃላይ ሞዴል
  • ሰኔ 17፣ 2024፡- DeepSeek Coder V2 ኮድ ሞዴል
  • ሴፕቴምበር 6፣ 2024፡- DeepSeek-V2.5 የአጠቃላይ እና የኮድ ብቃት ሞዴሎች ውህደት
  • ዲሴምበር 13፣ 2024፡- DeepSeek-VL2 መልቲሞዳል ሞኢ ሞዴል
  • ዲሴምበር 26፣ 2024፡- DeepSeek-V3 አዲስ ተከታታይ አጠቃላይ ዓላማ ትልቅ ሞዴሎች
  • ጃንዋሪ 20፣ 2025፡- DeepSeek-R1 የማጣቀሻ ሞዴል
  • ጃንዋሪ 20፣ 2025፡- DeepSeek ኦፊሴላዊ መተግበሪያ (iOS እና አንድሮይድ)
  • ጥር 27 ቀን 2025፡- DeepSeek Janus-Pro መልቲሞዳል ሞዴል

ተመሳሳይ ልጥፎች

ምላሽ ይስጡ

ኢ-ፖስታ አድራሻወ ይፋ አይደረግም። መሞላት ያለባቸው መስኮች * ምልክት አላቸው