एआई सर्कल में, DeepSeek R1 ने शारीरिक परीक्षणों में o1 और क्लाउड को लगातार पीछे छोड़ दिया है, और हम आरएल के स्वर्ण युग में प्रवेश कर चुके हैं।

हममें से किसी ने भी यह उम्मीद नहीं की थी कि एआई क्षेत्र में 2025 की शुरुआत इस तरह होगी।

1टीपी5टी सचमुच अद्भुत है!

हाल ही में, "रहस्यमयी पूर्वी शक्ति" DeepSeek सिलिकॉन वैली पर "कठोर नियंत्रण" कर रही है।

मैंने R1 से पाइथागोरस प्रमेय को विस्तार से समझाने के लिए कहा। यह सब AI ने बिना किसी गलती के 30 सेकंड से भी कम समय में कर दिया। संक्षेप में, यह खत्म हो गया।

घरेलू और विदेशी एआई हलकों में, साधारण नेटिज़ेंस ने अद्भुत और शक्तिशाली नई एआई (जो ओपन सोर्स भी है) की खोज की है, और अकादमिक विशेषज्ञों ने चिल्लाया है "हमें पकड़ना चाहिए"। ऐसी अफवाहें भी हैं कि विदेशी एआई कंपनियों को पहले से ही एक बड़े खतरे का सामना करना पड़ रहा है।

इस सप्ताह जारी किए गए DeepSeek R1 को ही लें। बिना किसी पर्यवेक्षित प्रशिक्षण के इसका शुद्ध सुदृढीकरण सीखने का मार्ग चौंकाने वाला है। पिछले साल दिसंबर में डीपसीक-वी3 बेस के विकास से लेकर ओपनएआई ओ1 के बराबर वर्तमान थिंकिंग चेन क्षमताओं तक, यह समय की बात लगती है।

लेकिन जबकि AI समुदाय तकनीकी रिपोर्ट पढ़ने और वास्तविक मापों की तुलना करने में व्यस्त है, लोगों को अभी भी R1 के बारे में संदेह है: कई बेंचमार्क को बेहतर प्रदर्शन करने में सक्षम होने के अलावा, क्या यह वास्तव में नेतृत्व कर सकता है?

विषयसूची

क्या यह “भौतिक नियमों” का अपना अनुकरण बना सकता है?

आपको यकीन नहीं होता? चलो बड़े मॉडल को पिनबॉल से खेलने दें?

हाल के दिनों में, AI समुदाय के कुछ लोग एक परीक्षण के प्रति जुनूनी हो गए हैं - एक समस्या को हल करने के लिए विभिन्न AI बड़े मॉडल (विशेष रूप से तथाकथित तर्क मॉडल) का परीक्षण करना: "एक निश्चित आकार के अंदर एक पीली गेंद को उछालने के लिए एक पायथन स्क्रिप्ट लिखें। आकार को धीरे-धीरे घुमाएँ और सुनिश्चित करें कि गेंद आकार के अंदर ही रहे।"

इस "रोटेटिंग बॉल" बेंचमार्क में कुछ मॉडल दूसरों से बेहतर प्रदर्शन करते हैं। कोरव्यू सीटीओ इवान फियोरवंती के अनुसार, घरेलू आर्टिफिशियल इंटेलिजेंस प्रयोगशाला DeepSeek के पास एक ओपन सोर्स बड़ा मॉडल R1 है जो OpenAI के o1 प्रो मॉडल को मात देता है, जिसकी कीमत OpenAI के ChatGPT प्रो प्रोग्राम के हिस्से के रूप में $200 प्रति माह है।

बाईं ओर OpenAI o1 है, और दाईं ओर DeepSeek R1 है। जैसा कि ऊपर बताया गया है, यहाँ संकेत है: "एक वर्ग के भीतर उछलती पीली गेंद के लिए एक पायथन स्क्रिप्ट लिखें, टकराव का पता लगाने को ठीक से संभालना सुनिश्चित करें। वर्ग को धीरे-धीरे घुमाएँ। इसे पायथन में लागू करें। सुनिश्चित करें कि गेंद वर्ग के भीतर रहे।"

एक्स पर एक अन्य उपयोगकर्ता के अनुसार, एंथ्रोपिक क्लाउड 3.5 सॉनेट और गूगल के जेमिनी 1.5 प्रो मॉडल ने भौतिक सिद्धांतों के बारे में गलत निर्णय लिया, जिससे गेंद अपने आकार से भटक गई। कुछ उपयोगकर्ताओं ने यह भी बताया है कि गूगल के नवीनतम जेमिनी 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल, साथ ही अपेक्षाकृत पुराने ओपनएआई जीपीटी-4o ने एक बार में मूल्यांकन पास कर लिया।

लेकिन यहां अंतर बताने का एक तरीका है:

इस ट्वीट के तहत नेटिज़ेंस ने कहा: o1 की क्षमता मूल रूप से बहुत अच्छी थी, लेकिन ओपनएआई द्वारा गति को अनुकूलित करने के बाद यह कमजोर हो गई, यहां तक कि $200 / माह सदस्यता संस्करण के साथ भी।

उछलती गेंद का अनुकरण करना एक क्लासिक प्रोग्रामिंग चुनौती है। सटीक सिमुलेशन टकराव का पता लगाने वाले एल्गोरिदम को जोड़ता है, जिसे यह पहचानने की आवश्यकता होती है कि दो ऑब्जेक्ट (जैसे कि एक गेंद और एक आकृति का किनारा) कब टकराते हैं। अनुचित तरीके से लिखा गया एल्गोरिदम सिमुलेशन के प्रदर्शन को प्रभावित कर सकता है या स्पष्ट भौतिक त्रुटियों का कारण बन सकता है।

एआई स्टार्टअप नूस रिसर्च के शोधकर्ता एन8 प्रोग्राम्स ने कहा कि उन्हें घूमते हुए सप्तभुज में उछलती गेंद को स्क्रैच से लिखने में लगभग दो घंटे लगे। "कई समन्वय प्रणालियों को ट्रैक किया जाना चाहिए, प्रत्येक प्रणाली में टकराव को कैसे संभाला जाता है, इसकी समझ की आवश्यकता है, और कोड को स्क्रैच से डिज़ाइन किया जाना चाहिए ताकि वह मज़बूत हो।"

हालाँकि उछलती गेंदें और घूमती आकृतियाँ प्रोग्रामिंग कौशल का एक उचित परीक्षण हैं, फिर भी वे बड़े मॉडलों के लिए नई परियोजनाएँ हैं, और संकेतों में छोटे-छोटे बदलाव भी अलग-अलग परिणाम दे सकते हैं। इसलिए अगर इसे अंततः बड़े AI मॉडल के लिए बेंचमार्क टेस्ट का हिस्सा बनना है, तो इसमें अभी भी सुधार की आवश्यकता है।

किसी भी स्थिति में, व्यावहारिक परीक्षणों की इस लहर के बाद, हमें बड़े मॉडलों के बीच क्षमताओं में अंतर का अंदाजा हो गया है।

DeepSeek नया "सिलिकॉन वैली मिथक" है

DeepSeek प्रशांत क्षेत्र में दहशत पैदा कर रहा है।

मेटा कर्मचारियों ने पोस्ट किया है कि "मेटा इंजीनियर DeepSeek का गहन विश्लेषण कर रहे हैं, ताकि वे इससे कुछ भी कॉपी करने का प्रयास कर सकें।"

एआई प्रौद्योगिकी स्टार्टअप स्केल एआई के संस्थापक एलेक्जेंडर वांग ने भी सार्वजनिक रूप से कहा कि DeepSeek के एआई बड़े मॉडल का प्रदर्शन संयुक्त राज्य अमेरिका के सर्वश्रेष्ठ मॉडल के बराबर है।

उनका यह भी मानना है कि पिछले एक दशक में एआई प्रतिस्पर्धा में संयुक्त राज्य अमेरिका चीन से आगे रहा हो सकता है, लेकिन DeepSeek के एआई बड़े मॉडल के जारी होने से "सब कुछ बदल सकता है।"

एक्स ब्लॉगर @8teAPi का मानना है कि DeepSeek कोई “साइड प्रोजेक्ट” नहीं है, बल्कि यह लॉकहीड मार्टिन के पूर्व “स्कंक वर्क्स” जैसा है।

तथाकथित "स्कंक वर्क्स" एक बेहद गोपनीय, अपेक्षाकृत स्वतंत्र छोटी टीम को संदर्भित करता है जिसे लॉकहीड मार्टिन ने मूल रूप से कई उन्नत विमान विकसित करने के लिए स्थापित किया था, जो अत्याधुनिक या अपरंपरागत प्रौद्योगिकी अनुसंधान और विकास में लगे हुए थे। U-2 टोही विमान और SR-71 ब्लैकबर्ड से लेकर F-22 रैप्टर और F-35 लाइटनिंग II लड़ाकू विमान तक, वे सभी यहीं से आए थे।

बाद में, यह शब्द धीरे-धीरे एक सामान्य शब्द के रूप में विकसित हो गया जिसका उपयोग बड़ी कंपनियों या संगठनों के भीतर स्थापित “छोटी लेकिन बढ़िया”, अपेक्षाकृत स्वतंत्र और अधिक लचीली नवाचार टीमों का वर्णन करने के लिए किया जाता है।

उन्होंने दो कारण बताये:

एक ओर, DeepSeek में GPU की संख्या बहुत अधिक है, कथित तौर पर 10,000 से अधिक, और स्केल AI के सीईओ एलेक्जेंडर वांग ने यहां तक कहा कि यह 50,000 तक पहुंच सकती है।
दूसरी ओर, DeepSeek केवल चीन के शीर्ष तीन विश्वविद्यालयों से प्रतिभाओं की भर्ती करता है, जिसका अर्थ है कि DeepSeek अलीबाबा और टेनसेंट के समान प्रतिस्पर्धी है।

ये दो तथ्य अकेले ही दर्शाते हैं कि DeepSeek ने स्पष्ट रूप से व्यावसायिक सफलता हासिल कर ली है और यह इन संसाधनों को प्राप्त करने के लिए पर्याप्त रूप से प्रसिद्ध है।

जहां तक DeepSeek की विकास लागत का सवाल है, ब्लॉगर ने कहा कि चीनी प्रौद्योगिकी कंपनियों को कम बिजली लागत और भूमि उपयोग जैसी कई तरह की सब्सिडी मिल सकती है।

इसलिए, यह बहुत संभव है कि DeepSeek की अधिकांश लागतें मुख्य व्यवसाय से बाहर के खाते में या किसी प्रकार की डेटा सेंटर निर्माण सब्सिडी के रूप में "रखी" गई हों।

संस्थापकों के अलावा भी कोई भी व्यक्ति सभी वित्तीय व्यवस्थाओं को पूरी तरह से नहीं समझता है। कुछ समझौते केवल “मौखिक समझौते” हो सकते हैं जिन्हें केवल प्रतिष्ठा के आधार पर अंतिम रूप दिया जाता है।

बहरहाल, कुछ बातें स्पष्ट हैं:

मॉडल उत्कृष्ट है, दो महीने पहले ओपनएआई द्वारा जारी किए गए संस्करण के बराबर है, और निश्चित रूप से यह संभव है कि यह ओपनएआई और एंथ्रोपिक द्वारा अभी तक जारी किए गए नए मॉडलों जितना अच्छा न हो।
वर्तमान परिप्रेक्ष्य से, अनुसंधान दिशा अभी भी अमेरिकी कंपनियों द्वारा हावी है। DeepSeek मॉडल o1 संस्करण का "त्वरित अनुवर्ती" है, लेकिन DeepSeek का अनुसंधान और विकास प्रगति बहुत तेज़ है, जो अपेक्षा से अधिक तेज़ी से आगे बढ़ रही है। वे साहित्यिक चोरी या धोखाधड़ी नहीं कर रहे हैं, वे अधिक से अधिक रिवर्स इंजीनियरिंग कर रहे हैं।
DeepSeek मुख्य रूप से अपनी स्वयं की प्रतिभा को प्रशिक्षित कर रहा है, न कि अमेरिकी प्रशिक्षित पीएचडी पर निर्भर है, जिससे प्रतिभा पूल का काफी विस्तार होता है।
अमेरिकी कंपनियों की तुलना में, DeepSeek बौद्धिक संपदा लाइसेंसिंग, गोपनीयता, सुरक्षा, राजनीति आदि के मामले में कम बाधाओं के अधीन है, और डेटा के गलत उपयोग के बारे में कम चिंताएं हैं, जिसके बारे में लोग प्रशिक्षित नहीं होना चाहते हैं। कम मुकदमे, कम वकील और कम चिंताएँ हैं।

इसमें कोई संदेह नहीं है कि अधिक से अधिक लोग मानते हैं कि 2025 एक निर्णायक वर्ष होगा। इस बीच, कंपनियाँ इसके लिए कमर कस रही हैं। उदाहरण के लिए, मेटा 2025 तक $60-65 बिलियन के अनुमानित निवेश के साथ 2GW+ डेटा सेंटर का निर्माण कर रहा है, और वर्ष के अंत तक उसके पास 1.3 मिलियन से अधिक GPU होंगे।

मेटा ने अपने 2-गीगावाट डेटा सेंटर की तुलना मैनहट्टन, न्यूयॉर्क से करने के लिए एक चार्ट का भी उपयोग किया।

लेकिन अब DeepSeek ने कम कीमत और कम GPU के साथ बेहतर प्रदर्शन किया है। इससे लोग चिंतित क्यों नहीं होंगे?

यान लेकन: हमें सीटीओ और सह-संस्थापक को धन्यवाद देना होगा the खुला स्त्रोत

युचेन जिन, यह पोस्ट करने के लिए अतिशयोक्तिपूर्ण है कि केवल 4 दिनों में, DeepSeek-R1 ने हमारे लिए 4 तथ्य सिद्ध कर दिए हैं:

ओपन सोर्स एआई, क्लोज्ड सोर्स एआई से केवल 6 महीने पीछे है
ओपन सोर्स एआई प्रतिस्पर्धा में चीन हावी हो रहा है
हम बड़े भाषा मॉडल सुदृढीकरण सीखने के स्वर्ण युग में प्रवेश कर रहे हैं
आसवन मॉडल बहुत शक्तिशाली हैं, और हम मोबाइल फोन पर अत्यधिक बुद्धिमान एआई चलाएंगे

DeepSeek द्वारा शुरू की गई श्रृंखला प्रतिक्रिया अभी भी जारी है, जैसे कि OpenAI o3-mini को मुफ्त में उपलब्ध कराया जाना, AGI/ASI के बारे में अस्पष्ट चर्चाओं को कम करने के लिए समुदाय में आशा, और यह अफवाह कि मेटा घबरा गया है।

उनका मानना है कि यह अनुमान लगाना मुश्किल है कि आखिरकार कौन जीतेगा, लेकिन हमें देर से आने वालों के लाभ की शक्ति को नहीं भूलना चाहिए। आखिरकार, हम सभी जानते हैं कि यह Google ही था जिसने ट्रांसफॉर्मर का आविष्कार किया था, जबकि OpenAI ने इसकी असली क्षमता को उजागर किया।

इसके अलावा, ट्यूरिंग पुरस्कार विजेता और मेटा के मुख्य एआई वैज्ञानिक यान लेकन ने भी अपने विचार व्यक्त किए।

"जो लोग DeepSeek के प्रदर्शन को देखकर सोचते हैं कि 'चीन AI में अमेरिका से आगे निकल रहा है', वे गलत हैं। सही समझ यह है कि ओपन सोर्स मॉडल मालिकाना मॉडल से आगे निकल रहे हैं।"

लेकुन ने कहा कि DeepSeek ने इस बार इतनी धूम मचाई है, क्योंकि उन्हें ओपन रिसर्च और ओपन सोर्स (जैसे मेटा के पायटॉर्च और लामा) से लाभ मिला है। DeepSeek नए विचारों के साथ आया है और दूसरों के काम पर निर्माण किया है। क्योंकि उनका काम सार्वजनिक रूप से जारी किया गया है और ओपन सोर्स है, इसलिए हर कोई इससे लाभ उठा सकता है। यह ओपन रिसर्च और ओपन सोर्स की शक्ति है।

नेटिज़न्स के विचार जारी हैं। जबकि वे नई तकनीकों के विकास के बारे में उत्साहित हैं, वे थोड़ी चिंता का माहौल भी महसूस कर सकते हैं। आखिरकार, DeepSeekers के उभरने का वास्तविक प्रभाव हो सकता है।

अवर्गीकृत

ताज़ा खबर! DeepSeek शोधकर्ता ने ऑनलाइन खुलासा किया: R1 प्रशिक्षण में केवल दो से तीन सप्ताह लगे, और चीनी नववर्ष की छुट्टियों के दौरान R1 शून्य का एक शक्तिशाली विकास देखा गया

द्वाराzddeepseeker फरवरी 4, 2025फरवरी 4, 2025

ब्रेकिंग न्यूज़! DeepSeek शोधकर्ता ने ऑनलाइन खुलासा किया: R1 प्रशिक्षण में केवल दो से तीन सप्ताह लगे, और चीनी नव वर्ष की छुट्टी के दौरान R1 शून्य का एक शक्तिशाली विकास देखा गया। अभी-अभी, हमने देखा कि DeepSeek शोधकर्ता दया गुओ ने DeepSeek R1 और कंपनी की आगे की योजनाओं के बारे में नेटिज़ेंस के सवालों का जवाब दिया। हम केवल इतना ही कह सकते हैं…

अवर्गीकृत

DeepSeek जैसे बड़े भाषा मॉडल प्रबंधन कलाकृतियाँ: चेरी स्टूडियो, चैटबॉक्स, एनीथिंगएलएलएम, आपका दक्षता त्वरक कौन है?

द्वाराzddeepseeker फ़रवरी 11, 2025फ़रवरी 11, 2025

बहुत से लोगों ने पहले ही डीपसीक लार्ज लैंग्वेज मॉडल को स्थानीय स्तर पर तैनात और उपयोग करना शुरू कर दिया है, चैटबॉक्स को विज़ुअलाइज़ेशन टूल के रूप में उपयोग कर रहे हैं। यह लेख दो अन्य AI लार्ज लैंग्वेज मॉडल प्रबंधन और विज़ुअलाइज़ेशन कलाकृतियों को पेश करना जारी रखेगा, और AI लार्ज लैंग्वेज मॉडल को अधिक कुशलता से उपयोग करने में आपकी मदद करने के लिए तीनों की विस्तार से तुलना करेगा। 2025 में,…

अवर्गीकृत

शीर्ष चार मॉडलों का मुक़ाबला! एक समीक्षा से पता चलता है कि डीपसीक आर1 कितना शक्तिशाली है

द्वाराzddeepseeker 1 जून, 20251 जून, 2025

पिछले कुछ दिनों में, डीपसीक-आर1 0528 को आधिकारिक तौर पर ओपन-सोर्स किया गया है। लाइवकोडबेंच पर, इसका प्रदर्शन ओपनएआई के ओ3 (उच्च) के बराबर है; एडर के बहुभाषी बेंचमार्क परीक्षण में, यह क्लाउड ओपस के मुकाबले अपनी स्थिति बनाए रखता है। जब इसे आधिकारिक वेबसाइट पर लॉन्च किया गया, तो हमने जल्दी से इसकी फ्रंट-एंड क्षमताओं का परीक्षण किया और पाया कि वे असाधारण रूप से…

अवर्गीकृत

Qwen2.5-max बनाम DeepSeek R1: मॉडलों की गहन तुलना: अनुप्रयोग परिदृश्यों का पूर्ण विश्लेषण

द्वाराzddeepseeker फ़रवरी 14, 2025फ़रवरी 14, 2025

परिचय आज, बड़े भाषा मॉडल (LLM) एक महत्वपूर्ण भूमिका निभाते हैं। 2025 की शुरुआत में, जैसे-जैसे AI के लिए प्रतिस्पर्धा तेज होती गई, अलीबाबा ने नया Qwen2.5-max AI मॉडल लॉन्च किया, और हांग्जो, चीन की एक कंपनी DeepSeek ने R1 मॉडल लॉन्च किया, जो LLM तकनीक के शिखर का प्रतिनिधित्व करता है। डीपसीक R1 एक ओपन सोर्स AI मॉडल है जिसने…

अवर्गीकृत

DeepSeek की स्थापना कैसे हुई? DeepSeek के विकास इतिहास का विश्लेषण

द्वाराzddeepseeker फरवरी 3, 2025फरवरी 3, 2025

भविष्य में, अधिक से अधिक कट्टर नवाचार होंगे। इसे अभी समझना आसान नहीं हो सकता है, क्योंकि पूरे सामाजिक समूह को तथ्यों से शिक्षित करने की आवश्यकता है। जब यह समाज कट्टर नवाचार करने वाले लोगों को सफल होने देगा, तो सामूहिक मानसिकता बदल जाएगी। हमें बस तथ्यों और एक प्रक्रिया की आवश्यकता है...

अवर्गीकृत

जेमिनी 2.0 चार्ट पर हावी है, जबकि DeepSeek V3 अपनी कीमत में रोता है, और एक नया लागत प्रभावी चैंपियन पैदा हुआ है!

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

Google Gemini 2.0 परिवार आखिरकार पूरा हो गया है! यह रिलीज़ होते ही चार्ट पर छा गया। डीपसीक, क्वेन और ओ3 की खोज और अवरोधों के बीच, Google ने आज सुबह एक साथ तीन मॉडल जारी किए: जेमिनी 2.0 प्रो, जेमिनी 2.0 फ्लैश और जेमिनी 2.0 फ्लैश-लाइट। बड़े मॉडल LMSYS रैंकिंग में, जेमिनी…

क्या यह “भौतिक नियमों” का अपना अनुकरण बना सकता है?

DeepSeek नया "सिलिकॉन वैली मिथक" है

यान लेकन: हमें सीटीओ और सह-संस्थापक को धन्यवाद देना होगा the खुला स्त्रोत

इसी तरह की पोस्ट

प्रातिक्रिया दे जवाब रद्द करें