एआई सर्कल में, DeepSeek R1 ने शारीरिक परीक्षणों में o1 और क्लाउड को लगातार पीछे छोड़ दिया है, और हम आरएल के स्वर्ण युग में प्रवेश कर चुके हैं।

हममें से किसी ने भी यह उम्मीद नहीं की थी कि एआई क्षेत्र में 2025 की शुरुआत इस तरह होगी।

1टीपी5टी सचमुच अद्भुत है!

हाल ही में, "रहस्यमयी पूर्वी शक्ति" DeepSeek सिलिकॉन वैली पर "कठोर नियंत्रण" कर रही है।

मैंने R1 से पाइथागोरस प्रमेय को विस्तार से समझाने के लिए कहा। यह सब AI ने बिना किसी गलती के 30 सेकंड से भी कम समय में कर दिया। संक्षेप में, यह खत्म हो गया।

घरेलू और विदेशी एआई हलकों में, साधारण नेटिज़ेंस ने अद्भुत और शक्तिशाली नई एआई (जो ओपन सोर्स भी है) की खोज की है, और अकादमिक विशेषज्ञों ने चिल्लाया है "हमें पकड़ना चाहिए"। ऐसी अफवाहें भी हैं कि विदेशी एआई कंपनियों को पहले से ही एक बड़े खतरे का सामना करना पड़ रहा है।

इस सप्ताह जारी किए गए DeepSeek R1 को ही लें। बिना किसी पर्यवेक्षित प्रशिक्षण के इसका शुद्ध सुदृढीकरण सीखने का मार्ग चौंकाने वाला है। पिछले साल दिसंबर में डीपसीक-वी3 बेस के विकास से लेकर ओपनएआई ओ1 के बराबर वर्तमान थिंकिंग चेन क्षमताओं तक, यह समय की बात लगती है।

लेकिन जबकि AI समुदाय तकनीकी रिपोर्ट पढ़ने और वास्तविक मापों की तुलना करने में व्यस्त है, लोगों को अभी भी R1 के बारे में संदेह है: कई बेंचमार्क को बेहतर प्रदर्शन करने में सक्षम होने के अलावा, क्या यह वास्तव में नेतृत्व कर सकता है?

विषयसूची

क्या यह “भौतिक नियमों” का अपना अनुकरण बना सकता है?

आपको यकीन नहीं होता? चलो बड़े मॉडल को पिनबॉल से खेलने दें?

हाल के दिनों में, AI समुदाय के कुछ लोग एक परीक्षण के प्रति जुनूनी हो गए हैं - एक समस्या को हल करने के लिए विभिन्न AI बड़े मॉडल (विशेष रूप से तथाकथित तर्क मॉडल) का परीक्षण करना: "एक निश्चित आकार के अंदर एक पीली गेंद को उछालने के लिए एक पायथन स्क्रिप्ट लिखें। आकार को धीरे-धीरे घुमाएँ और सुनिश्चित करें कि गेंद आकार के अंदर ही रहे।"

इस "रोटेटिंग बॉल" बेंचमार्क में कुछ मॉडल दूसरों से बेहतर प्रदर्शन करते हैं। कोरव्यू सीटीओ इवान फियोरवंती के अनुसार, घरेलू आर्टिफिशियल इंटेलिजेंस प्रयोगशाला DeepSeek के पास एक ओपन सोर्स बड़ा मॉडल R1 है जो OpenAI के o1 प्रो मॉडल को मात देता है, जिसकी कीमत OpenAI के ChatGPT प्रो प्रोग्राम के हिस्से के रूप में $200 प्रति माह है।

बाईं ओर OpenAI o1 है, और दाईं ओर DeepSeek R1 है। जैसा कि ऊपर बताया गया है, यहाँ संकेत है: "एक वर्ग के भीतर उछलती पीली गेंद के लिए एक पायथन स्क्रिप्ट लिखें, टकराव का पता लगाने को ठीक से संभालना सुनिश्चित करें। वर्ग को धीरे-धीरे घुमाएँ। इसे पायथन में लागू करें। सुनिश्चित करें कि गेंद वर्ग के भीतर रहे।"

एक्स पर एक अन्य उपयोगकर्ता के अनुसार, एंथ्रोपिक क्लाउड 3.5 सॉनेट और गूगल के जेमिनी 1.5 प्रो मॉडल ने भौतिक सिद्धांतों के बारे में गलत निर्णय लिया, जिससे गेंद अपने आकार से भटक गई। कुछ उपयोगकर्ताओं ने यह भी बताया है कि गूगल के नवीनतम जेमिनी 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल, साथ ही अपेक्षाकृत पुराने ओपनएआई जीपीटी-4o ने एक बार में मूल्यांकन पास कर लिया।

लेकिन यहां अंतर बताने का एक तरीका है:

इस ट्वीट के तहत नेटिज़ेंस ने कहा: o1 की क्षमता मूल रूप से बहुत अच्छी थी, लेकिन ओपनएआई द्वारा गति को अनुकूलित करने के बाद यह कमजोर हो गई, यहां तक कि $200 / माह सदस्यता संस्करण के साथ भी।

उछलती गेंद का अनुकरण करना एक क्लासिक प्रोग्रामिंग चुनौती है। सटीक सिमुलेशन टकराव का पता लगाने वाले एल्गोरिदम को जोड़ता है, जिसे यह पहचानने की आवश्यकता होती है कि दो ऑब्जेक्ट (जैसे कि एक गेंद और एक आकृति का किनारा) कब टकराते हैं। अनुचित तरीके से लिखा गया एल्गोरिदम सिमुलेशन के प्रदर्शन को प्रभावित कर सकता है या स्पष्ट भौतिक त्रुटियों का कारण बन सकता है।

एआई स्टार्टअप नूस रिसर्च के शोधकर्ता एन8 प्रोग्राम्स ने कहा कि उन्हें घूमते हुए सप्तभुज में उछलती गेंद को स्क्रैच से लिखने में लगभग दो घंटे लगे। "कई समन्वय प्रणालियों को ट्रैक किया जाना चाहिए, प्रत्येक प्रणाली में टकराव को कैसे संभाला जाता है, इसकी समझ की आवश्यकता है, और कोड को स्क्रैच से डिज़ाइन किया जाना चाहिए ताकि वह मज़बूत हो।"

हालाँकि उछलती गेंदें और घूमती आकृतियाँ प्रोग्रामिंग कौशल का एक उचित परीक्षण हैं, फिर भी वे बड़े मॉडलों के लिए नई परियोजनाएँ हैं, और संकेतों में छोटे-छोटे बदलाव भी अलग-अलग परिणाम दे सकते हैं। इसलिए अगर इसे अंततः बड़े AI मॉडल के लिए बेंचमार्क टेस्ट का हिस्सा बनना है, तो इसमें अभी भी सुधार की आवश्यकता है।

किसी भी स्थिति में, व्यावहारिक परीक्षणों की इस लहर के बाद, हमें बड़े मॉडलों के बीच क्षमताओं में अंतर का अंदाजा हो गया है।

DeepSeek नया "सिलिकॉन वैली मिथक" है

DeepSeek प्रशांत क्षेत्र में दहशत पैदा कर रहा है।

मेटा कर्मचारियों ने पोस्ट किया है कि "मेटा इंजीनियर DeepSeek का गहन विश्लेषण कर रहे हैं, ताकि वे इससे कुछ भी कॉपी करने का प्रयास कर सकें।"

एआई प्रौद्योगिकी स्टार्टअप स्केल एआई के संस्थापक एलेक्जेंडर वांग ने भी सार्वजनिक रूप से कहा कि DeepSeek के एआई बड़े मॉडल का प्रदर्शन संयुक्त राज्य अमेरिका के सर्वश्रेष्ठ मॉडल के बराबर है।

उनका यह भी मानना है कि पिछले एक दशक में एआई प्रतिस्पर्धा में संयुक्त राज्य अमेरिका चीन से आगे रहा हो सकता है, लेकिन DeepSeek के एआई बड़े मॉडल के जारी होने से "सब कुछ बदल सकता है।"

एक्स ब्लॉगर @8teAPi का मानना है कि DeepSeek कोई “साइड प्रोजेक्ट” नहीं है, बल्कि यह लॉकहीड मार्टिन के पूर्व “स्कंक वर्क्स” जैसा है।

तथाकथित "स्कंक वर्क्स" एक बेहद गोपनीय, अपेक्षाकृत स्वतंत्र छोटी टीम को संदर्भित करता है जिसे लॉकहीड मार्टिन ने मूल रूप से कई उन्नत विमान विकसित करने के लिए स्थापित किया था, जो अत्याधुनिक या अपरंपरागत प्रौद्योगिकी अनुसंधान और विकास में लगे हुए थे। U-2 टोही विमान और SR-71 ब्लैकबर्ड से लेकर F-22 रैप्टर और F-35 लाइटनिंग II लड़ाकू विमान तक, वे सभी यहीं से आए थे।

बाद में, यह शब्द धीरे-धीरे एक सामान्य शब्द के रूप में विकसित हो गया जिसका उपयोग बड़ी कंपनियों या संगठनों के भीतर स्थापित “छोटी लेकिन बढ़िया”, अपेक्षाकृत स्वतंत्र और अधिक लचीली नवाचार टीमों का वर्णन करने के लिए किया जाता है।

उन्होंने दो कारण बताये:

एक ओर, DeepSeek में GPU की संख्या बहुत अधिक है, कथित तौर पर 10,000 से अधिक, और स्केल AI के सीईओ एलेक्जेंडर वांग ने यहां तक कहा कि यह 50,000 तक पहुंच सकती है।
दूसरी ओर, DeepSeek केवल चीन के शीर्ष तीन विश्वविद्यालयों से प्रतिभाओं की भर्ती करता है, जिसका अर्थ है कि DeepSeek अलीबाबा और टेनसेंट के समान प्रतिस्पर्धी है।

ये दो तथ्य अकेले ही दर्शाते हैं कि DeepSeek ने स्पष्ट रूप से व्यावसायिक सफलता हासिल कर ली है और यह इन संसाधनों को प्राप्त करने के लिए पर्याप्त रूप से प्रसिद्ध है।

जहां तक DeepSeek की विकास लागत का सवाल है, ब्लॉगर ने कहा कि चीनी प्रौद्योगिकी कंपनियों को कम बिजली लागत और भूमि उपयोग जैसी कई तरह की सब्सिडी मिल सकती है।

इसलिए, यह बहुत संभव है कि DeepSeek की अधिकांश लागतें मुख्य व्यवसाय से बाहर के खाते में या किसी प्रकार की डेटा सेंटर निर्माण सब्सिडी के रूप में "रखी" गई हों।

संस्थापकों के अलावा भी कोई भी व्यक्ति सभी वित्तीय व्यवस्थाओं को पूरी तरह से नहीं समझता है। कुछ समझौते केवल “मौखिक समझौते” हो सकते हैं जिन्हें केवल प्रतिष्ठा के आधार पर अंतिम रूप दिया जाता है।

बहरहाल, कुछ बातें स्पष्ट हैं:

मॉडल उत्कृष्ट है, दो महीने पहले ओपनएआई द्वारा जारी किए गए संस्करण के बराबर है, और निश्चित रूप से यह संभव है कि यह ओपनएआई और एंथ्रोपिक द्वारा अभी तक जारी किए गए नए मॉडलों जितना अच्छा न हो।
वर्तमान परिप्रेक्ष्य से, अनुसंधान दिशा अभी भी अमेरिकी कंपनियों द्वारा हावी है। DeepSeek मॉडल o1 संस्करण का "त्वरित अनुवर्ती" है, लेकिन DeepSeek का अनुसंधान और विकास प्रगति बहुत तेज़ है, जो अपेक्षा से अधिक तेज़ी से आगे बढ़ रही है। वे साहित्यिक चोरी या धोखाधड़ी नहीं कर रहे हैं, वे अधिक से अधिक रिवर्स इंजीनियरिंग कर रहे हैं।
DeepSeek मुख्य रूप से अपनी स्वयं की प्रतिभा को प्रशिक्षित कर रहा है, न कि अमेरिकी प्रशिक्षित पीएचडी पर निर्भर है, जिससे प्रतिभा पूल का काफी विस्तार होता है।
अमेरिकी कंपनियों की तुलना में, DeepSeek बौद्धिक संपदा लाइसेंसिंग, गोपनीयता, सुरक्षा, राजनीति आदि के मामले में कम बाधाओं के अधीन है, और डेटा के गलत उपयोग के बारे में कम चिंताएं हैं, जिसके बारे में लोग प्रशिक्षित नहीं होना चाहते हैं। कम मुकदमे, कम वकील और कम चिंताएँ हैं।

इसमें कोई संदेह नहीं है कि अधिक से अधिक लोग मानते हैं कि 2025 एक निर्णायक वर्ष होगा। इस बीच, कंपनियाँ इसके लिए कमर कस रही हैं। उदाहरण के लिए, मेटा 2025 तक $60-65 बिलियन के अनुमानित निवेश के साथ 2GW+ डेटा सेंटर का निर्माण कर रहा है, और वर्ष के अंत तक उसके पास 1.3 मिलियन से अधिक GPU होंगे।

मेटा ने अपने 2-गीगावाट डेटा सेंटर की तुलना मैनहट्टन, न्यूयॉर्क से करने के लिए एक चार्ट का भी उपयोग किया।

लेकिन अब DeepSeek ने कम कीमत और कम GPU के साथ बेहतर प्रदर्शन किया है। इससे लोग चिंतित क्यों नहीं होंगे?

यान लेकन: हमें सीटीओ और सह-संस्थापक को धन्यवाद देना होगा the खुला स्त्रोत

युचेन जिन, यह पोस्ट करने के लिए अतिशयोक्तिपूर्ण है कि केवल 4 दिनों में, DeepSeek-R1 ने हमारे लिए 4 तथ्य सिद्ध कर दिए हैं:

ओपन सोर्स एआई, क्लोज्ड सोर्स एआई से केवल 6 महीने पीछे है
ओपन सोर्स एआई प्रतिस्पर्धा में चीन हावी हो रहा है
हम बड़े भाषा मॉडल सुदृढीकरण सीखने के स्वर्ण युग में प्रवेश कर रहे हैं
आसवन मॉडल बहुत शक्तिशाली हैं, और हम मोबाइल फोन पर अत्यधिक बुद्धिमान एआई चलाएंगे

DeepSeek द्वारा शुरू की गई श्रृंखला प्रतिक्रिया अभी भी जारी है, जैसे कि OpenAI o3-mini को मुफ्त में उपलब्ध कराया जाना, AGI/ASI के बारे में अस्पष्ट चर्चाओं को कम करने के लिए समुदाय में आशा, और यह अफवाह कि मेटा घबरा गया है।

उनका मानना है कि यह अनुमान लगाना मुश्किल है कि आखिरकार कौन जीतेगा, लेकिन हमें देर से आने वालों के लाभ की शक्ति को नहीं भूलना चाहिए। आखिरकार, हम सभी जानते हैं कि यह Google ही था जिसने ट्रांसफॉर्मर का आविष्कार किया था, जबकि OpenAI ने इसकी असली क्षमता को उजागर किया।

इसके अलावा, ट्यूरिंग पुरस्कार विजेता और मेटा के मुख्य एआई वैज्ञानिक यान लेकन ने भी अपने विचार व्यक्त किए।

"जो लोग DeepSeek के प्रदर्शन को देखकर सोचते हैं कि 'चीन AI में अमेरिका से आगे निकल रहा है', वे गलत हैं। सही समझ यह है कि ओपन सोर्स मॉडल मालिकाना मॉडल से आगे निकल रहे हैं।"

लेकुन ने कहा कि DeepSeek ने इस बार इतनी धूम मचाई है, क्योंकि उन्हें ओपन रिसर्च और ओपन सोर्स (जैसे मेटा के पायटॉर्च और लामा) से लाभ मिला है। DeepSeek नए विचारों के साथ आया है और दूसरों के काम पर निर्माण किया है। क्योंकि उनका काम सार्वजनिक रूप से जारी किया गया है और ओपन सोर्स है, इसलिए हर कोई इससे लाभ उठा सकता है। यह ओपन रिसर्च और ओपन सोर्स की शक्ति है।

नेटिज़न्स के विचार जारी हैं। जबकि वे नई तकनीकों के विकास के बारे में उत्साहित हैं, वे थोड़ी चिंता का माहौल भी महसूस कर सकते हैं। आखिरकार, DeepSeekers के उभरने का वास्तविक प्रभाव हो सकता है।

अवर्गीकृत

DeepSeek जैसे बड़े भाषा मॉडल प्रबंधन कलाकृतियाँ: चेरी स्टूडियो, चैटबॉक्स, एनीथिंगएलएलएम, आपका दक्षता त्वरक कौन है?

द्वाराzddeepseeker फ़रवरी 11, 2025फ़रवरी 11, 2025

बहुत से लोगों ने पहले ही डीपसीक लार्ज लैंग्वेज मॉडल को स्थानीय स्तर पर तैनात और उपयोग करना शुरू कर दिया है, चैटबॉक्स को विज़ुअलाइज़ेशन टूल के रूप में उपयोग कर रहे हैं। यह लेख दो अन्य AI लार्ज लैंग्वेज मॉडल प्रबंधन और विज़ुअलाइज़ेशन कलाकृतियों को पेश करना जारी रखेगा, और AI लार्ज लैंग्वेज मॉडल को अधिक कुशलता से उपयोग करने में आपकी मदद करने के लिए तीनों की विस्तार से तुलना करेगा। 2025 में,…

अवर्गीकृत

Qwen2.5-max बनाम DeepSeek R1: मॉडलों की गहन तुलना: अनुप्रयोग परिदृश्यों का पूर्ण विश्लेषण

द्वाराzddeepseeker फ़रवरी 14, 2025फ़रवरी 14, 2025

परिचय आज, बड़े भाषा मॉडल (LLM) एक महत्वपूर्ण भूमिका निभाते हैं। 2025 की शुरुआत में, जैसे-जैसे AI के लिए प्रतिस्पर्धा तेज होती गई, अलीबाबा ने नया Qwen2.5-max AI मॉडल लॉन्च किया, और हांग्जो, चीन की एक कंपनी DeepSeek ने R1 मॉडल लॉन्च किया, जो LLM तकनीक के शिखर का प्रतिनिधित्व करता है। डीपसीक R1 एक ओपन सोर्स AI मॉडल है जिसने…

अवर्गीकृत

DeepSeek-R1 प्रौद्योगिकी का खुलासा: शोधपत्र के मूल सिद्धांतों को तोड़ा गया और सफल मॉडल प्रदर्शन की कुंजी का खुलासा किया गया

द्वाराzddeepseeker फरवरी 9, 2025फरवरी 9, 2025

आज हम DeepSeek R1, शीर्षक: DeepSeek-R1: सुदृढीकरण सीखने के माध्यम से LLM में तर्क क्षमता को प्रोत्साहित करना: सुदृढीकरण सीखने के माध्यम से LLM की तर्क क्षमता को प्रोत्साहित करना साझा करेंगे। यह पेपर DeepSeek के तर्क मॉडल की पहली पीढ़ी, DeepSeek-R1-Zero और DeepSeek-R1 का परिचय देता है। DeepSeek-R1-Zero मॉडल को प्रारंभिक चरण के रूप में पर्यवेक्षित फ़ाइन-ट्यूनिंग (SFT) के बिना बड़े पैमाने पर सुदृढीकरण सीखने (RL) के माध्यम से प्रशिक्षित किया गया था,…

अवर्गीकृत

सौ बिलियन डॉलर के निवेश के साथ ले चैट शीर्ष पर है। अमेरिका और चीन के बाद, क्या यह तीसरी एआई शक्ति है?

द्वाराzddeepseeker फ़रवरी 11, 2025फ़रवरी 11, 2025

9 फरवरी को, फ्रांस के राष्ट्रपति इमैनुएल मैक्रों ने घोषणा की कि फ्रांस अगले कुछ वर्षों में AI के क्षेत्र में 109 बिलियन यूरो (113 बिलियन अमेरिकी डॉलर) का निवेश करेगा। इस निवेश का उपयोग फ्रांस में AI पार्क बनाने, बुनियादी ढांचे में सुधार करने और स्थानीय AI स्टार्ट-अप में निवेश करने के लिए किया जाएगा। इस बीच, मिस्ट्रल, एक फ्रांसीसी स्टार्टअप, ने घोषणा की कि वह अगले कुछ वर्षों में AI के क्षेत्र में 109 बिलियन यूरो (113 बिलियन अमेरिकी डॉलर) का निवेश करेगा।

अवर्गीकृत

DeepSeek 1 के पीछे का रहस्य | DeepSeekMath और GRPO विवरण

द्वाराzddeepseeker फरवरी 9, 2025फरवरी 9, 2025

आज मैं DeepSeek से एक लेख साझा करना चाहूँगा, जिसका शीर्षक है DeepSeekMath: ओपन लैंग्वेज मॉडल में गणितीय तर्क की सीमाओं को आगे बढ़ाना। यह लेख DeepSeekMath 7B का परिचय देता है, जो 120B गणित-संबंधित टोकन, प्राकृतिक भाषा और कोड डेटा के संग्रह के आधार पर DeepSeek-Coder-Base-v1.5 7B पर पूर्व-प्रशिक्षित है। मॉडल ने प्रतिस्पर्धी-स्तर में 51.7% का आश्चर्यजनक स्कोर हासिल किया…

अवर्गीकृत

गूगल ने एक साथ तीन नए मॉडल जारी किए हैं: जेमिनी-2.0-प्रो निःशुल्क है, इसका स्कोर उत्कृष्ट है और यह प्रथम स्थान पर है, तथा यह कोडिंग और जटिल प्रॉम्प्ट के प्रसंस्करण के लिए उपयुक्त है!

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

जेमिनी 2.0 की कहानी तेज़ी से आगे बढ़ रही है। दिसंबर में फ्लैश थिंकिंग एक्सपेरीमेंटल संस्करण ने डेवलपर्स को कम विलंबता और उच्च प्रदर्शन वाला एक कार्यशील मॉडल दिया। इस साल की शुरुआत में, Google AI स्टूडियो में 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल को अपडेट किया गया था ताकि फ्लैश की गति को बेहतर अनुमान क्षमताओं के साथ जोड़कर प्रदर्शन को और बेहतर बनाया जा सके। पिछले हफ़्ते,…

क्या यह “भौतिक नियमों” का अपना अनुकरण बना सकता है?

DeepSeek नया "सिलिकॉन वैली मिथक" है

यान लेकन: हमें सीटीओ और सह-संस्थापक को धन्यवाद देना होगा the खुला स्त्रोत

इसी तरह की पोस्ट

प्रातिक्रिया दे जवाब रद्द करें