
की कहानी जेमीएनआई 2.0 तेजी आ रही है.
दिसंबर में फ्लैश थिंकिंग प्रायोगिक संस्करण ने डेवलपर्स को कम विलंबता और उच्च प्रदर्शन वाला एक कार्यशील मॉडल दिया।
इस वर्ष की शुरुआत में, Google AI स्टूडियो में 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल को अपडेट किया गया था, ताकि फ्लैश की गति को उन्नत अनुमान क्षमताओं के साथ जोड़कर प्रदर्शन को और बेहतर बनाया जा सके।
पिछले सप्ताह, अपडेटेड संस्करण 2.0 फ्लैश को जेमिनी डेस्कटॉप और मोबाइल ऐप पर पूरी तरह से लॉन्च किया गया था।
आज, एक ही समय में तीन नए सदस्यों का अनावरण किया गया है: जेमिनी 2.0 प्रो का प्रायोगिक संस्करण, जिसने अब तक कोडिंग और जटिल प्रॉम्प्ट में सर्वश्रेष्ठ प्रदर्शन किया है, लागत प्रभावी 2.0 फ्लैश-लाइट, और सोच-संवर्धित संस्करण 2.0 फ्लैश थिंकिंग।
जेमिनी 2.0 प्रो सभी श्रेणियों में पहले स्थान पर है। जेमिनी-2.0-फ्लैश कोडिंग, गणित और पहेलियों में शीर्ष तीन में है। फ्लैश-लाइट सभी श्रेणियों में शीर्ष दस में है।


तीन मॉडलों की क्षमताओं का तुलनात्मक चार्ट:

सभी मॉडल मल्टीमॉडल इनपुट और आउटपुट टेक्स्ट का समर्थन करते हैं।
और भी मोडल क्षमताएँ आने वाली हैं। कोडिंग क्षेत्र में मॉडल शक्ति चार्ट

जीत दर हीट मैप

Google मुफ़्त उपयोगकर्ताओं के साथ OpenAI के प्लस उपयोगकर्ताओं से बेहतर व्यवहार करता है। AI स्टूडियो में Gemini 2.0 Pro Experimental तक निःशुल्क पहुँच:

डीपसीक सेवा हमेशा एक त्रुटि प्रदर्शित करती है... याद रखें कि पहला अनुमान-मुक्त मॉडल भी 2.0 फ्लैश थिंकिंग था, जिसका उपयोग Google aistudio में किया गया था।

इसके अलावा, वहाँ है जेमिनी का वेब संस्करण:
एक जुड़ा हुआ अनुमान मॉडल भी है (तो इसे अलग क्यों करें ...)

गूगल ने जेमिनी 2.0 प्रो का प्रायोगिक संस्करण जारी किया है, और आधिकारिक बेंचमार्क परीक्षणों में सुधार काफी आकर्षक है।

इसमें सबसे शक्तिशाली कोडिंग क्षमताएं और जटिल संकेतों को संसाधित करने की क्षमता है, तथा गूगल द्वारा अब तक जारी किए गए किसी भी मॉडल की तुलना में विश्व ज्ञान को समझने और तर्क करने की बेहतर क्षमता है।
इसमें सबसे बड़ी संदर्भ विंडो है (200k, और मेरा लंबा संदर्भ जेमिनी मॉडल का एक अपेक्षाकृत बड़ा लाभ है), जो इसे बड़ी मात्रा में जानकारी का व्यापक रूप से विश्लेषण और समझने, तथा गूगल खोज और कोड निष्पादन जैसे उपकरणों को कॉल करने में सक्षम बनाता है।
MATH परीक्षण में, इसने 91.8% हासिल किया, जो संस्करण 1.5 की तुलना में लगभग 5 प्रतिशत अंकों की वृद्धि थी। GPQA तर्क क्षमता 64.7% तक पहुंच गई, और SimpleQA विश्व ज्ञान परीक्षण भी 44.3% तक पहुंच गया।
सबसे उल्लेखनीय है प्रोग्रामिंग क्षमता। इसने लाइवकोडबेंच परीक्षण में 36.0% हासिल किया, और बर्ड-एसक्यूएल रूपांतरण सटीकता 59.3% से अधिक हो गई। 2 मिलियन टोकन की सुपर-बड़ी संदर्भ विंडो के साथ युग्मित, यह सबसे जटिल कोड विश्लेषण कार्यों को संभालने के लिए पर्याप्त है।

आप इसे कर्सर में आज़मा सकते हैं।
बहुभाषी समझ क्षमता भी प्रभावशाली है, वैश्विक MMLU परीक्षण स्कोर 86.5% है। छवि समझ MMMU 72.7% है, और वीडियो विश्लेषण क्षमता 71.9% है।
जेमिनी 2.0 फ्लैश-लाइट एक दिलचस्प संतुलन है।
यह 1.5 फ्लैश की गति और लागत को बनाए रखता है, लेकिन बेहतर प्रदर्शन लाता है। 1 मिलियन टोकन वाली संदर्भ विंडो इसे अधिक जानकारी संसाधित करने की अनुमति देती है।
सबसे व्यावहारिक बात इसकी कीमत/प्रदर्शन अनुपात है: 40,000 फ़ोटो के लिए कैप्शन बनाने की लागत $1 से कम है। यह AI को और अधिक व्यावहारिक बनाता है।

ब्लॉगर श्रीवास्तव ने उल्लेख किया: जेमिनी 2.0 प्रो एनकोडिंग अद्भुत है!
टिप: सोलर सिस्टम सिमुलेशन बनाने के लिए Three.js का उपयोग करें। टाइम स्केल, फ़ोकस ड्रॉप-डाउन मेनू, शो ऑर्बिट और शो लेबल जोड़ें। सब कुछ एक फ़ाइल में बनाएँ ताकि मैं इसे ऑनलाइन एडिटर में पेस्ट कर सकूँ और आउटपुट देख सकूँ।

इसके अतिरिक्त, कुछ उपयोगकर्ताओं ने बताया कि जेमिनी 2.0 फ्लैश ने अपने स्वयं के विरोधाभास परीक्षणों में से एक में बेहतर परिणाम दिए:

अंत में, गूगल ने बताया कि जेमिनी 2.0 की सुरक्षा, न कि केवल पैच, शुरू से ही इसके डिजाइन के मूल में है।
मॉडल को आत्म-आलोचनात्मक होना सीखने दें। सुदृढीकरण सीखने का उपयोग करके जेमिनी को अपने स्वयं के उत्तरों का मूल्यांकन करने दें और अधिक सटीक प्रतिक्रिया प्रदान करें। संवेदनशील विषयों से निपटने के दौरान यह इसे अधिक मजबूत बनाता है।
स्वचालित रेड टीम परीक्षण दिलचस्प है। इसे विशेष रूप से अप्रत्यक्ष संकेत शब्दों के इंजेक्शन को रोकने के लिए डिज़ाइन किया गया है, जो किसी को डेटा में दुर्भावनापूर्ण कमांड छिपाने से रोकने के लिए AI को प्रतिरक्षा प्रणाली से लैस करने जैसा है।