पछिल्ला केही दिनहरूमा, Deepseek-R1 0528 आधिकारिक रूपमा खुला-स्रोत गरिएको छ। LiveCodeBench मा, यसको प्रदर्शन लगभग OpenAI को o3 (उच्च) सँग बराबर छ; Aider को बहु-भाषा बेन्चमार्क परीक्षणमा, यसले Claude Opus विरुद्ध आफ्नो स्थान राख्छ। जब यो आधिकारिक वेबसाइटमा सुरु गरिएको थियो, हामीले यसको फ्रन्ट-एन्ड क्षमताहरूको द्रुत रूपमा परीक्षण गर्यौं र तिनीहरूलाई असाधारण रूपमा फेला पार्यौं...
१TP५टी मोडेलको संस्करणमा सामान्य स्तरोन्नति गरिएको छ, हालको संस्करण १TP८टी-आर१-०५२८ छ। जब तपाईं १TP८टी वेबपेज वा एपमा प्रवेश गर्नुहुन्छ, पछिल्लो संस्करण अनुभव गर्न संवाद इन्टरफेसमा "गहिरो सोच" सुविधा सक्षम गर्नुहोस्। १TP८टी-आर१-०५२८ मोडेलको तौल हगिङफेसमा अपलोड गरिएको छ। विगत चार महिनामा, १TP८टी-आर१ मा…
गत हप्ता, DeepSeek ले अर्को हप्ता पाँचवटा परियोजनाहरू ओपन सोर्स गर्ने घोषणा गर्यो: नेटिजनहरूले भने, "यस पटक, OpenAI साँच्चै यहाँ छ।" भर्खरै, पहिलो खुला स्रोत परियोजना आयो, अनुमान त्वरणसँग सम्बन्धित, FlashMLA: खुला स्रोत परियोजना ठेगाना: DeepSeek FlashMLA यो दुई घण्टादेखि खुला स्रोत भएको छ, र Github मा पहिले नै 2.7k+ ताराहरू छन्: द…
FlashMLA ले कृत्रिम बुद्धिमत्ताको संसारमा, विशेष गरी ठूला भाषा मोडेलहरू (LLMs) को क्षेत्रमा द्रुत रूपमा ध्यान आकर्षित गरेको छ। DeepSeek द्वारा विकसित यो नवीन उपकरणले Hopper GPU हरूको लागि डिजाइन गरिएको एक अनुकूलित डिकोडिङ कर्नेलको रूपमा काम गर्दछ - उच्च-प्रदर्शन चिपहरू जुन सामान्यतया AI गणनाहरूमा प्रयोग गरिन्छ। FlashMLA ले चर-लम्बाइ अनुक्रमहरूको कुशल प्रशोधनमा केन्द्रित छ, यसलाई विशेष रूपमा राम्रोसँग उपयुक्त बनाउँछ...