zddeepseeker - डीपसीक R1 - पृष्ठ 2 का 3

अवर्गीकृत

DeepSeek-R1 प्रौद्योगिकी का खुलासा: शोधपत्र के मूल सिद्धांतों को तोड़ा गया और सफल मॉडल प्रदर्शन की कुंजी का खुलासा किया गया

द्वाराzddeepseeker फरवरी 9, 2025फरवरी 9, 2025

आज हम DeepSeek R1, शीर्षक: DeepSeek-R1: सुदृढीकरण सीखने के माध्यम से LLM में तर्क क्षमता को प्रोत्साहित करना: सुदृढीकरण सीखने के माध्यम से LLM की तर्क क्षमता को प्रोत्साहित करना साझा करेंगे। यह पेपर DeepSeek के तर्क मॉडल की पहली पीढ़ी, DeepSeek-R1-Zero और DeepSeek-R1 का परिचय देता है। DeepSeek-R1-Zero मॉडल को प्रारंभिक चरण के रूप में पर्यवेक्षित फ़ाइन-ट्यूनिंग (SFT) के बिना बड़े पैमाने पर सुदृढीकरण सीखने (RL) के माध्यम से प्रशिक्षित किया गया था,…

अवर्गीकृत

DeepSeek R1 पेपर व्याख्या और मुख्य तकनीकी बिंदु

द्वाराzddeepseeker फरवरी 9, 2025फरवरी 9, 2025

1 पृष्ठभूमि वसंत महोत्सव के दौरान, DeepSeek R1 ने एक बार फिर व्यापक ध्यान आकर्षित किया, और यहां तक कि DeepSeek V3 व्याख्या लेख जिसे हमने पहले लिखा था, उसे भी पुनः प्रसारित किया गया और उस पर बहुत चर्चा हुई। हालाँकि DeepSeek R1 के कई विश्लेषण और पुनरुत्पादन हुए हैं, यहाँ हमने कुछ संगत पठन नोट्स संकलित करने का निर्णय लिया है। हम तीन…

गूगल का कम लागत वाला मॉडल, जेमिनी 2.0 सीरीज, आक्रामक है: बड़े मॉडलों में लागत प्रभावशीलता की लड़ाई तेज हो रही है

अवर्गीकृत

गूगल का कम लागत वाला मॉडल, जेमिनी 2.0 सीरीज, आक्रामक है: बड़े मॉडलों में लागत प्रभावशीलता की लड़ाई तेज हो रही है

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

बड़े AI मॉडल का उपयोग करने की उच्च लागत एक प्रमुख कारण है कि कई AI अनुप्रयोगों को अभी तक लागू और प्रचारित नहीं किया गया है। चरम प्रदर्शन का चयन करने का मतलब है विशाल कंप्यूटिंग शक्ति लागत, जो उच्च उपयोग लागत की ओर ले जाती है जिसे सामान्य उपयोगकर्ता स्वीकार नहीं कर सकते। बड़े AI मॉडल के लिए प्रतिस्पर्धा धुएँ के बिना युद्ध की तरह है। बाद में…

जेमिनी 2.0 चार्ट पर हावी है, जबकि DeepSeek V3 अपनी कीमत में रोता है, और एक नया लागत प्रभावी चैंपियन पैदा हुआ है!

अवर्गीकृत

जेमिनी 2.0 चार्ट पर हावी है, जबकि DeepSeek V3 अपनी कीमत में रोता है, और एक नया लागत प्रभावी चैंपियन पैदा हुआ है!

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

Google Gemini 2.0 परिवार आखिरकार पूरा हो गया है! यह रिलीज़ होते ही चार्ट पर छा गया। डीपसीक, क्वेन और ओ3 की खोज और अवरोधों के बीच, Google ने आज सुबह एक साथ तीन मॉडल जारी किए: जेमिनी 2.0 प्रो, जेमिनी 2.0 फ्लैश और जेमिनी 2.0 फ्लैश-लाइट। बड़े मॉडल LMSYS रैंकिंग में, जेमिनी…

27 वर्षीय सीईओ के साथ a16z संवाद: AI एजेंट का बहुत बड़ा उत्तोलन प्रभाव है, और दीर्घकालिक मूल्य निर्धारण श्रम लागत से जुड़ा होगा

अवर्गीकृत

27 वर्षीय सीईओ के साथ a16z संवाद: AI एजेंट का बहुत बड़ा उत्तोलन प्रभाव है, और दीर्घकालिक मूल्य निर्धारण श्रम लागत से जुड़ा होगा

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

हाइलाइट्स एआई एजेंट ग्राहक अनुभव को नया आकार देता है जेसी झांग: एजेंट वास्तव में कैसे बनाया जाता है? हमारा विचार है कि समय के साथ, यह अधिक से अधिक प्राकृतिक भाषा-आधारित एजेंट की तरह बन जाएगा क्योंकि इसी तरह बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित किया जाता है। लंबे समय में, यदि आपके पास एक सुपर इंटेलिजेंट एजेंट है जो…

अवर्गीकृत

कैथी वुड: DeepSeek केवल लागत में कमी की प्रक्रिया को तेज कर रहा है; महामंदी के समय की तुलना में अत्यधिक संकेन्द्रित बाजार संरचना बदल जाएगी

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

हाइलाइट्स DeepSeek के साथ प्रतिस्पर्धा अमेरिका के लिए अच्छी है कैथी वुड: मुझे लगता है कि यह दर्शाता है कि नवाचार की लागत नाटकीय रूप से कम हो रही है, और यह प्रवृत्ति पहले ही शुरू हो चुकी है। उदाहरण के लिए, DeepSeek से पहले, कृत्रिम बुद्धिमत्ता के प्रशिक्षण की लागत प्रति वर्ष 75% कम हो गई थी, और अनुमान की लागत भी 85% तक कम हो गई थी…

अवर्गीकृत

गूगल ने एक साथ तीन नए मॉडल जारी किए हैं: जेमिनी-2.0-प्रो निःशुल्क है, इसका स्कोर उत्कृष्ट है और यह प्रथम स्थान पर है, तथा यह कोडिंग और जटिल प्रॉम्प्ट के प्रसंस्करण के लिए उपयुक्त है!

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

जेमिनी 2.0 की कहानी तेज़ी से आगे बढ़ रही है। दिसंबर में फ्लैश थिंकिंग एक्सपेरीमेंटल संस्करण ने डेवलपर्स को कम विलंबता और उच्च प्रदर्शन वाला एक कार्यशील मॉडल दिया। इस साल की शुरुआत में, Google AI स्टूडियो में 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल को अपडेट किया गया था ताकि फ्लैश की गति को बेहतर अनुमान क्षमताओं के साथ जोड़कर प्रदर्शन को और बेहतर बनाया जा सके। पिछले हफ़्ते,…

अवर्गीकृत

अली क्वेन 2.5-मैक्स ने DeepSeek-V3 को पीछे छोड़ा! नेटिजन: चीन का AI तेजी से अंतर कम कर रहा है

द्वाराzddeepseeker फरवरी 5, 2025फरवरी 5, 2025

अभी हाल ही में अली की ओर से बिग मॉडल एरिना सूची में एक और घरेलू मॉडल जोड़ा गया, क्वेन 2.5-मैक्स, जिसने DeepSeek-V3 को पीछे छोड़ दिया और 1332 के कुल स्कोर के साथ समग्र रैंकिंग में सातवें स्थान पर रहा। इसने क्लाउड 3.5 सॉनेट और लामा 3.1 405B जैसे मॉडलों को भी एक झटके में पीछे छोड़ दिया। विशेष रूप से, यह प्रोग्रामिंग में उत्कृष्ट है…

ताज़ा खबर! DeepSeek शोधकर्ता ने ऑनलाइन खुलासा किया: R1 प्रशिक्षण में केवल दो से तीन सप्ताह लगे, और चीनी नववर्ष की छुट्टियों के दौरान R1 शून्य का एक शक्तिशाली विकास देखा गया

अवर्गीकृत

ताज़ा खबर! DeepSeek शोधकर्ता ने ऑनलाइन खुलासा किया: R1 प्रशिक्षण में केवल दो से तीन सप्ताह लगे, और चीनी नववर्ष की छुट्टियों के दौरान R1 शून्य का एक शक्तिशाली विकास देखा गया

द्वाराzddeepseeker फरवरी 4, 2025फरवरी 4, 2025

ब्रेकिंग न्यूज़! DeepSeek शोधकर्ता ने ऑनलाइन खुलासा किया: R1 प्रशिक्षण में केवल दो से तीन सप्ताह लगे, और चीनी नव वर्ष की छुट्टी के दौरान R1 शून्य का एक शक्तिशाली विकास देखा गया। अभी-अभी, हमने देखा कि DeepSeek शोधकर्ता दया गुओ ने DeepSeek R1 और कंपनी की आगे की योजनाओं के बारे में नेटिज़ेंस के सवालों का जवाब दिया। हम केवल इतना ही कह सकते हैं…

DeepSeek R1 रचनात्मक लेखन परीक्षण में प्रथम आया, और o3 मिनी, o1 मिनी से भी बदतर था!

अवर्गीकृत

DeepSeek R1 रचनात्मक लेखन परीक्षण में प्रथम आया, और o3 मिनी, o1 मिनी से भी बदतर था!

द्वाराzddeepseeker फरवरी 3, 2025फरवरी 3, 2025

DeepSeek R1 ने क्रिएटिव शॉर्ट स्टोरी राइटिंग बेंचमार्क टेस्ट में चैंपियनशिप जीती, पिछले प्रमुख खिलाड़ी क्लाउड 3.5 सॉनेट को सफलतापूर्वक पीछे छोड़ दिया! बेंचमार्क टेस्ट शोधकर्ता लेक माज़ूर द्वारा डिज़ाइन किया गया बेंचमार्क टेस्ट आपकी औसत लेखन प्रतियोगिता नहीं है। प्रत्येक AI मॉडल को 500 लघु कथाएँ पूरी करनी थीं, और प्रत्येक कहानी को चतुराई से शामिल करना था…