DeepSeek 1 के पीछे का रहस्य | DeepSeekMath और GRPO विवरण

DeepSeek 1 के पीछे का रहस्य | DeepSeekMath और GRPO विवरण

आज मैं DeepSeek से एक लेख साझा करना चाहूँगा, जिसका शीर्षक है DeepSeekMath: ओपन लैंग्वेज मॉडल में गणितीय तर्क की सीमाओं को आगे बढ़ाना। यह लेख DeepSeekMath 7B का परिचय देता है, जो 120B गणित-संबंधित टोकन, प्राकृतिक भाषा और कोड डेटा के संग्रह के आधार पर DeepSeek-Coder-Base-v1.5 7B पर पूर्व-प्रशिक्षित है। मॉडल ने प्रतिस्पर्धी-स्तर में 51.7% का आश्चर्यजनक स्कोर हासिल किया…

DeepSeek-R1 प्रौद्योगिकी का खुलासा: शोधपत्र के मूल सिद्धांतों को तोड़ा गया और सफल मॉडल प्रदर्शन की कुंजी का खुलासा किया गया

आज हम DeepSeek R1, शीर्षक: DeepSeek-R1: सुदृढीकरण सीखने के माध्यम से LLM में तर्क क्षमता को प्रोत्साहित करना: सुदृढीकरण सीखने के माध्यम से LLM की तर्क क्षमता को प्रोत्साहित करना साझा करेंगे। यह पेपर DeepSeek के तर्क मॉडल की पहली पीढ़ी, DeepSeek-R1-Zero और DeepSeek-R1 का परिचय देता है। DeepSeek-R1-Zero मॉडल को प्रारंभिक चरण के रूप में पर्यवेक्षित फ़ाइन-ट्यूनिंग (SFT) के बिना बड़े पैमाने पर सुदृढीकरण सीखने (RL) के माध्यम से प्रशिक्षित किया गया था,…

DeepSeek R1 पेपर व्याख्या और मुख्य तकनीकी बिंदु

1 पृष्ठभूमि वसंत महोत्सव के दौरान, DeepSeek R1 ने एक बार फिर व्यापक ध्यान आकर्षित किया, और यहां तक कि DeepSeek V3 व्याख्या लेख जिसे हमने पहले लिखा था, उसे भी पुनः प्रसारित किया गया और उस पर बहुत चर्चा हुई। हालाँकि DeepSeek R1 के कई विश्लेषण और पुनरुत्पादन हुए हैं, यहाँ हमने कुछ संगत पठन नोट्स संकलित करने का निर्णय लिया है। हम तीन…

गूगल का कम लागत वाला मॉडल, जेमिनी 2.0 सीरीज, आक्रामक है: बड़े मॉडलों में लागत प्रभावशीलता की लड़ाई तेज हो रही है

गूगल का कम लागत वाला मॉडल, जेमिनी 2.0 सीरीज, आक्रामक है: बड़े मॉडलों में लागत प्रभावशीलता की लड़ाई तेज हो रही है

बड़े AI मॉडल का उपयोग करने की उच्च लागत एक प्रमुख कारण है कि कई AI अनुप्रयोगों को अभी तक लागू और प्रचारित नहीं किया गया है। चरम प्रदर्शन का चयन करने का मतलब है विशाल कंप्यूटिंग शक्ति लागत, जो उच्च उपयोग लागत की ओर ले जाती है जिसे सामान्य उपयोगकर्ता स्वीकार नहीं कर सकते। बड़े AI मॉडल के लिए प्रतिस्पर्धा धुएँ के बिना युद्ध की तरह है। बाद में…

जेमिनी 2.0 चार्ट पर हावी है, जबकि DeepSeek V3 अपनी कीमत में रोता है, और एक नया लागत प्रभावी चैंपियन पैदा हुआ है!

जेमिनी 2.0 चार्ट पर हावी है, जबकि DeepSeek V3 अपनी कीमत में रोता है, और एक नया लागत प्रभावी चैंपियन पैदा हुआ है!

Google Gemini 2.0 परिवार आखिरकार पूरा हो गया है! यह रिलीज़ होते ही चार्ट पर छा गया। डीपसीक, क्वेन और ओ3 की खोज और अवरोधों के बीच, Google ने आज सुबह एक साथ तीन मॉडल जारी किए: जेमिनी 2.0 प्रो, जेमिनी 2.0 फ्लैश और जेमिनी 2.0 फ्लैश-लाइट। बड़े मॉडल LMSYS रैंकिंग में, जेमिनी…

27 वर्षीय सीईओ के साथ a16z संवाद: AI एजेंट का बहुत बड़ा उत्तोलन प्रभाव है, और दीर्घकालिक मूल्य निर्धारण श्रम लागत से जुड़ा होगा

27 वर्षीय सीईओ के साथ a16z संवाद: AI एजेंट का बहुत बड़ा उत्तोलन प्रभाव है, और दीर्घकालिक मूल्य निर्धारण श्रम लागत से जुड़ा होगा

हाइलाइट्स एआई एजेंट ग्राहक अनुभव को नया आकार देता है जेसी झांग: एजेंट वास्तव में कैसे बनाया जाता है? हमारा विचार है कि समय के साथ, यह अधिक से अधिक प्राकृतिक भाषा-आधारित एजेंट की तरह बन जाएगा क्योंकि इसी तरह बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित किया जाता है। लंबे समय में, यदि आपके पास एक सुपर इंटेलिजेंट एजेंट है जो…

कैथी वुड: DeepSeek केवल लागत में कमी की प्रक्रिया को तेज कर रहा है; महामंदी के समय की तुलना में अत्यधिक संकेन्द्रित बाजार संरचना बदल जाएगी

हाइलाइट्स DeepSeek के साथ प्रतिस्पर्धा अमेरिका के लिए अच्छी है कैथी वुड: मुझे लगता है कि यह दर्शाता है कि नवाचार की लागत नाटकीय रूप से कम हो रही है, और यह प्रवृत्ति पहले ही शुरू हो चुकी है। उदाहरण के लिए, DeepSeek से पहले, कृत्रिम बुद्धिमत्ता के प्रशिक्षण की लागत प्रति वर्ष 75% कम हो गई थी, और अनुमान की लागत भी 85% तक कम हो गई थी…

गूगल ने एक साथ तीन नए मॉडल जारी किए हैं: जेमिनी-2.0-प्रो निःशुल्क है, इसका स्कोर उत्कृष्ट है और यह प्रथम स्थान पर है, तथा यह कोडिंग और जटिल प्रॉम्प्ट के प्रसंस्करण के लिए उपयुक्त है!

जेमिनी 2.0 की कहानी तेज़ी से आगे बढ़ रही है। दिसंबर में फ्लैश थिंकिंग एक्सपेरीमेंटल संस्करण ने डेवलपर्स को कम विलंबता और उच्च प्रदर्शन वाला एक कार्यशील मॉडल दिया। इस साल की शुरुआत में, Google AI स्टूडियो में 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल को अपडेट किया गया था ताकि फ्लैश की गति को बेहतर अनुमान क्षमताओं के साथ जोड़कर प्रदर्शन को और बेहतर बनाया जा सके। पिछले हफ़्ते,…

DeepSeek TOP17 सर्वश्रेष्ठ विकल्प: व्यापक विश्लेषण (2025)

DeepSeek TOP17 सर्वश्रेष्ठ विकल्प: व्यापक विश्लेषण (2025)

परिचय कृत्रिम बुद्धिमत्ता के तेजी से विकसित हो रहे परिदृश्य में, DeepSeek एक शक्तिशाली भाषा मॉडल के रूप में उभरा है। यह व्यापक विश्लेषण DeepSeek के शीर्ष 17 विकल्पों की खोज करता है, उनकी अनूठी विशेषताओं, क्षमताओं और उपयोग के मामलों की जांच करता है। हमारा शोध अंतरराष्ट्रीय और चीनी दोनों प्लेटफ़ॉर्म पर केंद्रित है जो DeepSeek एकीकरण या समान क्षमताएँ प्रदान करते हैं। शीर्ष विकल्प विश्लेषण 1….

अली क्वेन 2.5-मैक्स ने DeepSeek-V3 को पीछे छोड़ा! नेटिजन: चीन का AI तेजी से अंतर कम कर रहा है

अभी हाल ही में अली की ओर से बिग मॉडल एरिना सूची में एक और घरेलू मॉडल जोड़ा गया, क्वेन 2.5-मैक्स, जिसने DeepSeek-V3 को पीछे छोड़ दिया और 1332 के कुल स्कोर के साथ समग्र रैंकिंग में सातवें स्थान पर रहा। इसने क्लाउड 3.5 सॉनेट और लामा 3.1 405B जैसे मॉडलों को भी एक झटके में पीछे छोड़ दिया। विशेष रूप से, यह प्रोग्रामिंग में उत्कृष्ट है…