zddeepseeker - Deepseek R1 - ३ मध्ये पृष्ठ २

अवर्गीकृत

DeepSeek-R1 प्रविधिको खुलासा: पेपरका मुख्य सिद्धान्तहरू तोडिएका छन् र सफलतापूर्वक मोडेल प्रदर्शनको कुञ्जी प्रकट गरिएको छ।

द्वाराzddeepseeker फेब्रुअरी ९, २०२५फेब्रुअरी ९, २०२५

आज हामी DeepSeek R1 साझा गर्नेछौं, शीर्षक: DeepSeek-R1: सुदृढीकरण सिकाइ मार्फत LLM मा तर्क क्षमतालाई प्रोत्साहन: सुदृढीकरण सिकाइ मार्फत LLM को तर्क क्षमतालाई प्रोत्साहन। यो पेपरले DeepSeek को पहिलो पुस्ताको तर्क मोडेलहरू, DeepSeek-R1-शून्य र DeepSeek-R1 लाई परिचय गराउँछ। DeepSeek-R1-शून्य मोडेललाई प्रारम्भिक चरणको रूपमा पर्यवेक्षित फाइन-ट्युनिङ (SFT) बिना ठूलो मात्रामा सुदृढीकरण सिकाइ (RL) मार्फत प्रशिक्षित गरिएको थियो,…

अवर्गीकृत

DeepSeek R1 पेपर व्याख्या र मुख्य प्राविधिक बुँदाहरू

द्वाराzddeepseeker फेब्रुअरी ९, २०२५फेब्रुअरी ९, २०२५

१ पृष्ठभूमि वसन्त महोत्सवको समयमा, १TP५T ले फेरि एक पटक व्यापक ध्यान आकर्षित गर्‍यो, र हामीले पहिले लेखेको १TP८T V३ व्याख्या लेख पनि पुन: प्रसारित भयो र धेरै छलफल गरियो। यद्यपि १TP५T को धेरै विश्लेषण र पुनरुत्पादनहरू भएका छन्, यहाँ हामीले केही सम्बन्धित पठन नोटहरू संकलन गर्ने निर्णय गरेका छौं। हामी तीन प्रयोग गर्नेछौं...

गुगलको कम लागतको मोडेल, जेमिनी २.० शृङ्खला, आक्रमण गर्दैछ: ठूला मोडेलहरूमा लागत-प्रभावकारिताको लागि लडाईं तीव्र हुँदैछ।

अवर्गीकृत

गुगलको कम लागतको मोडेल, जेमिनी २.० शृङ्खला, आक्रमण गर्दैछ: ठूला मोडेलहरूमा लागत-प्रभावकारिताको लागि लडाईं तीव्र हुँदैछ।

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

ठूला एआई मोडेलहरू प्रयोग गर्ने उच्च लागत धेरै एआई अनुप्रयोगहरू अझै कार्यान्वयन र प्रवर्द्धन नगर्नुको प्रमुख कारण हो। चरम प्रदर्शन छनौट गर्नु भनेको ठूलो कम्प्युटिङ पावर लागत हो, जसले गर्दा उच्च उपयोग लागतहरू हुन्छन् जुन सामान्य प्रयोगकर्ताहरूले स्वीकार गर्न सक्दैनन्। ठूला एआई मोडेलहरूको लागि प्रतिस्पर्धा धुवाँ बिनाको युद्ध जस्तै हो। पछि…

जेमिनी २.० ले चार्टमा प्रभुत्व जमाउँछ, जबकि १TP८T V३ ले यसको मूल्यमा रोमाञ्चकता ल्याउँछ, र एक नयाँ लागत-प्रभावी च्याम्पियनको जन्म हुन्छ!

अवर्गीकृत

जेमिनी २.० ले चार्टमा प्रभुत्व जमाउँछ, जबकि १TP८T V३ ले यसको मूल्यमा रोमाञ्चकता ल्याउँछ, र एक नयाँ लागत-प्रभावी च्याम्पियनको जन्म हुन्छ!

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

गुगल जेमिनी २.० परिवार अन्ततः पूरा भयो! यो रिलिज हुने बित्तिकै चार्टमा प्रभुत्व जमाउँछ। डिपसिक, क्वेन र ओ३ को खोजी र नाकाबन्दीका बीचमा, गुगलले आज बिहान एकै पटक तीन मोडेलहरू रिलिज गर्‍यो: जेमिनी २.० प्रो, जेमिनी २.० फ्ल्यास र जेमिनी २.० फ्ल्यास-लाइट। ठूलो मोडेल LMSYS रैंकिंगमा, जेमिनी…

२७ वर्षीय सीईओसँग a16z संवाद: एआई एजेन्टको ठूलो लाभ प्रभाव छ, र दीर्घकालीन मूल्य निर्धारण श्रम लागतसँग जोडिएको हुनेछ।

अवर्गीकृत

२७ वर्षीय सीईओसँग a16z संवाद: एआई एजेन्टको ठूलो लाभ प्रभाव छ, र दीर्घकालीन मूल्य निर्धारण श्रम लागतसँग जोडिएको हुनेछ।

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

हाइलाइटहरू एआई एजेन्टले ग्राहकको अनुभवलाई पुन: आकार दिन्छ जेसी झाङ: एजेन्ट वास्तवमा कसरी निर्माण गरिन्छ? हाम्रो विचार यो छ कि समयसँगै, यो प्राकृतिक भाषा-आधारित एजेन्ट जस्तै हुँदै जानेछ किनभने ठूला भाषा मोडेलहरू (LLMs) लाई यसरी नै तालिम दिइन्छ। लामो अवधिमा, यदि तपाईंसँग एक सुपर बुद्धिमान एजेन्ट छ भने ...

अवर्गीकृत

क्याथी वुड: DeepSeek ले लागत घटाउने प्रक्रियालाई तीव्र बनाइरहेको छ; महामन्दीसँग तुलना गर्न सकिने चरम केन्द्रित बजार संरचना परिवर्तन हुनेछ।

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

हाइलाइटहरू DeepSeek सँगको प्रतिस्पर्धा अमेरिकाको लागि राम्रो छ क्याथी वुड: मलाई लाग्छ यसले नवप्रवर्तनको लागत नाटकीय रूपमा घट्दै गएको देखाउँछ, र यो प्रवृत्ति पहिले नै सुरु भइसकेको छ। उदाहरणका लागि, DeepSeek अघि, कृत्रिम बुद्धिमत्ता प्रशिक्षणको लागत प्रति वर्ष 75% ले घटेको थियो, र अनुमानको लागत पनि 85% ले घटेको थियो ...

अवर्गीकृत

गुगलले एकैचोटि तीन नयाँ मोडेलहरू जारी गरेको छ: जेमिनी-२.०-प्रो नि:शुल्क छ, उत्कृष्ट स्कोर छ र पहिलो स्थानमा छ, र जटिल प्रम्प्टहरू कोडिङ र प्रशोधन गर्न उपयुक्त छ!

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

जेमिनी २.० को कथा तीव्र गतिमा अगाडि बढिरहेको छ। डिसेम्बरमा आएको फ्ल्यास थिंकिङ एक्सपेरिमेन्टल संस्करणले विकासकर्ताहरूलाई कम विलम्बता र उच्च प्रदर्शनको साथ काम गर्ने मोडेल ल्यायो। यस वर्षको सुरुमा, २.० फ्ल्यास थिंकिङ एक्सपेरिमेन्टललाई गुगल एआई स्टुडियोमा अपडेट गरिएको थियो ताकि फ्ल्यासको गतिलाई बढाइएको अनुमान क्षमताहरूसँग संयोजन गरेर प्रदर्शनलाई अझ सुधार गर्न सकियोस्। गत हप्ता,…

अवर्गीकृत

अली क्वेन२.५-म्याक्सले १TP८T-V३ लाई उछिने! नेटिजन: चीनको एआईले द्रुत गतिमा अन्तर घटाउँदैछ

द्वाराzddeepseeker फेब्रुअरी ५, २०२५फेब्रुअरी ५, २०२५

भर्खरै, अलिबाट बिग मोडेल एरिना सूचीमा अर्को घरेलु मोडेल थपियो, Qwen2.5-Max, जसले DeepSeek-V3 लाई उछिनेर समग्र श्रेणीमा १३३२ को कुल स्कोरका साथ सातौं स्थानमा रह्यो। यसले क्लाउड ३.५ सोनेट र लामा ३.१ ४०५B जस्ता मोडेलहरूलाई पनि एकै झट्कामा उछिनेको छ। विशेष गरी, यो प्रोग्रामिङमा उत्कृष्ट छ...

ब्रेकिङ न्यूज! DeepSeek अनुसन्धानकर्ताले अनलाइन खुलासा गरे: R1 तालिममा दुई देखि तीन हप्ता मात्र लाग्यो, र चिनियाँ नयाँ वर्षको बिदामा R1 शून्यको शक्तिशाली विकास अवलोकन गरिएको थियो।

अवर्गीकृत

ब्रेकिङ न्यूज! DeepSeek अनुसन्धानकर्ताले अनलाइन खुलासा गरे: R1 तालिममा दुई देखि तीन हप्ता मात्र लाग्यो, र चिनियाँ नयाँ वर्षको बिदामा R1 शून्यको शक्तिशाली विकास अवलोकन गरिएको थियो।

द्वाराzddeepseeker फेब्रुअरी ४, २०२५फेब्रुअरी ४, २०२५

ब्रेकिङ न्युज! DeepSeek अनुसन्धानकर्ताले अनलाइन खुलासा गरे: R1 तालिममा दुई देखि तीन हप्ता मात्र लाग्यो, र चिनियाँ नयाँ वर्षको बिदामा R1 शून्यको शक्तिशाली विकास अवलोकन गरिएको थियो। भर्खरै, हामीले याद गर्यौं कि DeepSeek अनुसन्धानकर्ता दया गुओले DeepSeek R1 र कम्पनीको भविष्यको योजनाहरूको बारेमा नेटिजनहरूको प्रश्नहरूको जवाफ दिए। हामी केवल भन्न सक्छौं ...

DeepSeek R1 रचनात्मक लेखन परीक्षणमा पहिलो आयो, र o3 mini o1 mini भन्दा पनि खराब थियो!

अवर्गीकृत

DeepSeek R1 रचनात्मक लेखन परीक्षणमा पहिलो आयो, र o3 mini o1 mini भन्दा पनि खराब थियो!

द्वाराzddeepseeker फेब्रुअरी ३, २०२५फेब्रुअरी ३, २०२५

DeepSeek R1 ले क्रिएटिभ लघुकथा लेखन बेन्चमार्क परीक्षणमा च्याम्पियनशिप जित्यो, अघिल्लो प्रभावशाली खेलाडी क्लाउड 3.5 सनेटलाई सफलतापूर्वक पार गर्दै! बेन्चमार्क परीक्षण शोधकर्ता लेच माजुर द्वारा डिजाइन गरिएको बेन्चमार्क परीक्षण तपाईंको औसत लेखन प्रतिस्पर्धा होइन। प्रत्येक एआई मोडेलले 500 छोटो कथाहरू पूरा गर्न आवश्यक थियो, र प्रत्येक कथाले चलाखीपूर्वक समावेश गर्नुपर्थ्यो...