zddeepseeker - डिपसिक R1

शीर्ष चार मोडेलहरूको प्रदर्शन! समीक्षाले Deepseek R1 कति शक्तिशाली छ भनेर देखाउँछ

द्वाराzddeepseeker जुन १, २०२५जुन १, २०२५

पछिल्ला केही दिनहरूमा, Deepseek-R1 0528 आधिकारिक रूपमा खुला-स्रोत गरिएको छ। LiveCodeBench मा, यसको प्रदर्शन लगभग OpenAI को o3 (उच्च) सँग बराबर छ; Aider को बहु-भाषा बेन्चमार्क परीक्षणमा, यसले Claude Opus विरुद्ध आफ्नो स्थान राख्छ। जब यो आधिकारिक वेबसाइटमा सुरु गरिएको थियो, हामीले यसको फ्रन्ट-एन्ड क्षमताहरूको द्रुत रूपमा परीक्षण गर्यौं र तिनीहरूलाई असाधारण रूपमा फेला पार्यौं...

अवर्गीकृत

DeepSeek-R1-0528 अपडेट: गहिरो सोच, बलियो तर्क

द्वाराzddeepseeker मे २९, २०२५मे २९, २०२५

१TP५टी मोडेलको संस्करणमा सामान्य स्तरोन्नति गरिएको छ, हालको संस्करण १TP८टी-आर१-०५२८ छ। जब तपाईं १TP८टी वेबपेज वा एपमा प्रवेश गर्नुहुन्छ, पछिल्लो संस्करण अनुभव गर्न संवाद इन्टरफेसमा "गहिरो सोच" सुविधा सक्षम गर्नुहोस्। १TP८टी-आर१-०५२८ मोडेलको तौल हगिङफेसमा अपलोड गरिएको छ। विगत चार महिनामा, १TP८टी-आर१ मा…

अवर्गीकृत

DeepSeek ले आफ्नो स्रोत कोड, FlashMLA को विस्तृत व्याख्या जारी गरेको छ।

द्वाराzddeepseeker फेब्रुअरी २४, २०२५फेब्रुअरी २४, २०२५

गत हप्ता, DeepSeek ले अर्को हप्ता पाँचवटा परियोजनाहरू ओपन सोर्स गर्ने घोषणा गर्‍यो: नेटिजनहरूले भने, "यस पटक, OpenAI साँच्चै यहाँ छ।" भर्खरै, पहिलो खुला स्रोत परियोजना आयो, अनुमान त्वरणसँग सम्बन्धित, FlashMLA: खुला स्रोत परियोजना ठेगाना: DeepSeek FlashMLA यो दुई घण्टादेखि खुला स्रोत भएको छ, र Github मा पहिले नै 2.7k+ ताराहरू छन्: द…

अवर्गीकृत

Qwen2.5-max vs DeepSeek R1: मोडेलहरूको गहिरो तुलना: अनुप्रयोग परिदृश्यहरूको पूर्ण विश्लेषण

द्वाराzddeepseeker फेब्रुअरी १४, २०२५फेब्रुअरी १४, २०२५

परिचय आज, ठूला भाषा मोडेलहरू (LLMs) ले महत्त्वपूर्ण भूमिका खेल्छन्। २०२५ को सुरुमा, AI को लागि प्रतिस्पर्धा तीव्र हुँदै जाँदा, Alibaba ले नयाँ Qwen2.5-max AI मोडेल लन्च गर्‍यो, र चीनको हांग्जोको कम्पनी DeepSeek ले R1 मोडेल लन्च गर्‍यो, जसले LLM प्रविधिको शिखर प्रतिनिधित्व गर्दछ। Deepseek R1 एक खुला स्रोत AI मोडेल हो जसले आकर्षित गरेको छ...

अवर्गीकृत

यो DeepSeek-R1-32B को नजिक छ र Fei-Fei Li को s1 लाई क्रस गर्छ! UC बर्कले र अन्य खुला स्रोत नयाँ SOTA अनुमान मोडेलहरू

द्वाराzddeepseeker फेब्रुअरी १४, २०२५फेब्रुअरी १४, २०२५

३२B अनुमान मोडेलले डेटाको १/८ भाग मात्र प्रयोग गर्दछ र उही आकारको १TP8T-R1 सँग बाँधिएको छ! भर्खरै, स्ट्यानफोर्ड, UC बर्कले, र वाशिंगटन विश्वविद्यालय जस्ता संस्थाहरूले संयुक्त रूपमा SOTA-स्तरको अनुमान मोडेल, OpenThinker-32B जारी गरेका छन्, र ११४k सम्मको प्रशिक्षण डेटा पनि खुला स्रोतमा राखेका छन्। OpenThinker परियोजना गृहपृष्ठ: OpenThinker Hugging Face:…

अवर्गीकृत

DeepSeek: चेरी स्टुडियो, च्याटबक्स, एनिथिङएलएलएम जस्ता ठूला भाषा मोडेल व्यवस्थापन कलाकृतिहरू, तपाईंको दक्षता गतिवर्धक को हो?

द्वाराzddeepseeker फेब्रुअरी ११, २०२५फेब्रुअरी ११, २०२५

धेरै मानिसहरूले पहिले नै स्थानीय रूपमा Deepseek ठूला भाषा मोडेलहरू तैनाथ र प्रयोग गर्न थालेका छन्, च्याटबक्सलाई दृश्य उपकरणको रूपमा प्रयोग गर्दै। यस लेखले दुई अन्य AI ठूलो भाषा मोडेल व्यवस्थापन र दृश्य कलाकृतिहरू परिचय गराउँदै जानेछ, र तपाईंलाई AI ठूलो भाषा मोडेलहरू अझ प्रभावकारी रूपमा प्रयोग गर्न मद्दत गर्न तीनवटाको विस्तृत रूपमा तुलना गर्नेछ। २०२५ मा,…

अवर्गीकृत

सय अर्ब डलर लगानीसहित ले च्याट शीर्ष स्थानमा छ। अमेरिका र चीन पछि, के यो तेस्रो एआई पावर हो?

द्वाराzddeepseeker फेब्रुअरी ११, २०२५फेब्रुअरी ११, २०२५

फेब्रुअरी ९ मा, फ्रान्सेली राष्ट्रपति इमानुएल म्याक्रोनले घोषणा गरे कि फ्रान्सले आगामी केही वर्षहरूमा एआईको क्षेत्रमा १०९ अर्ब युरो (११३ अर्ब अमेरिकी डलर) लगानी गर्नेछ। यो लगानी फ्रान्समा एआई पार्क निर्माण गर्न, पूर्वाधार सुधार गर्न र स्थानीय एआई स्टार्ट-अपहरूमा लगानी गर्न प्रयोग गरिनेछ। यसैबीच, मिस्ट्रल, एक फ्रान्सेली स्टार्टअप,…

अवर्गीकृत

Deepseek ले के हासिल गर्न सक्छ? OpenAI ले पनि गर्न सक्दैन?

द्वाराzddeepseeker फेब्रुअरी १०, २०२५फेब्रुअरी १०, २०२५

१TP८T को वास्तविक मूल्यलाई कम आँकलन गरिएको छ! १TP८T-R१ ले निस्सन्देह बजारमा उत्साहको नयाँ लहर ल्याएको छ। प्रासंगिक तथाकथित लाभार्थी लक्ष्यहरू तीव्र रूपमा बढिरहेका मात्र छैनन्, तर केही मानिसहरूले यसबाट पैसा कमाउने प्रयासमा १TP८T-सम्बन्धित पाठ्यक्रमहरू र सफ्टवेयर पनि विकास गरेका छन्। हामी विश्वास गर्छौं कि यद्यपि यी घटनाहरूले…

अवर्गीकृत

विश्वका मुख्यधाराका एआई उत्पादनहरू विश्लेषण र व्यापक प्रयोगकर्ता अनुभव दिशानिर्देशहरूमा केन्द्रित छन् (१TP8T र GPT सहित)

द्वाराzddeepseeker फेब्रुअरी १०, २०२५फेब्रुअरी १०, २०२५

फंक्शन पोजिसनिङ र कोर फाइदा विश्लेषण ChatGPT (OpenAI) - अलराउन्डरहरूको लागि विश्वव्यापी बेन्चमार्क ChatGPT प्राविधिक जीनहरू: ठूला मोडेलहरूको GPT श्रृंखलामा आधारित जेनेरेटिभ AI, सामान्य कुराकानी सीप र तार्किक तर्क यसको मुख्य फाइदाहरूको रूपमा। बहुभाषिक प्रशोधन: चिनियाँ भाषामा निरन्तर सुधारको साथ अंग्रेजीमा उत्कृष्ट प्रदर्शन गर्दछ; तर हामी अंग्रेजी प्रयोग गर्न सिफारिस गर्छौं ...

अवर्गीकृत

DeepSeek 1 पछाडिको रहस्य | DeepSeekMath र GRPO विवरणहरू

द्वाराzddeepseeker फेब्रुअरी ९, २०२५फेब्रुअरी ९, २०२५

आज म DeepSeek बाट एउटा लेख साझा गर्न चाहन्छु, जसको शीर्षक हो DeepSeekMath: खुला भाषा मोडेलहरूमा गणितीय तर्कको सीमाहरू धकेल्दै। यो लेखले DeepSeekMath 7B लाई परिचय गराउँछ, जुन DeepSeek-Coder-Base-v1.5 7B मा पूर्व-प्रशिक्षित छ जुन 120B गणित-सम्बन्धित टोकनहरू, प्राकृतिक भाषा र कोड डेटाको संग्रहमा आधारित छ। मोडेलले प्रतिस्पर्धात्मक-स्तरमा 51.7% को आश्चर्यजनक स्कोर हासिल गर्यो...