पिछले कुछ दिनों में, डीपसीक-आर1 0528 को आधिकारिक तौर पर ओपन-सोर्स किया गया है। लाइवकोडबेंच पर, इसका प्रदर्शन ओपनएआई के ओ3 (उच्च) के बराबर है; एडर के बहुभाषी बेंचमार्क परीक्षण में, यह क्लाउड ओपस के मुकाबले अपनी स्थिति बनाए रखता है। जब इसे आधिकारिक वेबसाइट पर लॉन्च किया गया, तो हमने जल्दी से इसकी फ्रंट-एंड क्षमताओं का परीक्षण किया और पाया कि वे असाधारण रूप से…
DeepSeek R1 मॉडल में मामूली संस्करण अपग्रेड किया गया है, वर्तमान संस्करण DeepSeek-R1-0528 है। जब आप DeepSeek वेबपेज या ऐप में प्रवेश करते हैं, तो नवीनतम संस्करण का अनुभव करने के लिए डायलॉग इंटरफ़ेस में "डीप थिंकिंग" सुविधा को सक्षम करें। DeepSeek-R1-0528 मॉडल के वज़न को HuggingFace पर अपलोड किया गया है पिछले चार महीनों में, DeepSeek-R1 में कई बदलाव हुए हैं…
पिछले सप्ताह, DeepSeek ने घोषणा की कि वह अगले सप्ताह पांच परियोजनाओं को ओपन सोर्स करेगा: नेटिज़ेंस ने कहा, "इस बार, OpenAI वास्तव में यहाँ है।" अभी, पहला ओपन सोर्स प्रोजेक्ट आया, जो अनुमान त्वरण से संबंधित है, FlashMLA: ओपन सोर्स प्रोजेक्ट का पता: DeepSeek FlashMLA यह दो घंटे के लिए ओपन सोर्स रहा है, और Github पर पहले से ही 2.7k+ स्टार हैं:…
फ्लैशएमएलए ने कृत्रिम बुद्धिमत्ता की दुनिया में, विशेष रूप से बड़े भाषा मॉडल (एलएलएम) के क्षेत्र में तेजी से ध्यान आकर्षित किया है। DeepSeek द्वारा विकसित यह अभिनव उपकरण हॉपर जीपीयू के लिए डिज़ाइन किए गए एक अनुकूलित डिकोडिंग कर्नेल के रूप में कार्य करता है - उच्च प्रदर्शन वाले चिप्स जो आमतौर पर एआई कंप्यूटेशन में उपयोग किए जाते हैं। फ्लैशएमएलए चर-लंबाई अनुक्रमों की कुशल प्रसंस्करण पर ध्यान केंद्रित करता है, जो इसे विशेष रूप से उपयुक्त बनाता है…