
को कथा जेमीni २.० तीव्र गतिमा बढिरहेको छ।
डिसेम्बरमा आएको फ्ल्यास थिङ्किङ एक्सपेरिमेन्टल संस्करणले विकासकर्ताहरूलाई कम विलम्बता र उच्च प्रदर्शनको साथ काम गर्ने मोडेल ल्यायो।
यस वर्षको सुरुमा, गुगल एआई स्टुडियोमा २.० फ्ल्यास थिंकिङ एक्सपेरिमेन्टल अपडेट गरिएको थियो जसले गर्दा फ्ल्यासको गतिलाई बढाइएको अनुमान क्षमताहरूसँग संयोजन गरेर कार्यसम्पादनमा थप सुधार गर्न सकियोस्।
गत हप्ता, अपडेट गरिएको संस्करण २.० फ्ल्यास जेमिनी डेस्कटप र मोबाइल एपहरूमा पूर्ण रूपमा लन्च गरिएको थियो।
आज, एकै समयमा तीन नयाँ सदस्यहरू अनावरण गरिएको छ: जेमिनी २.० प्रोको प्रयोगात्मक संस्करण, जसले अहिलेसम्म कोडिङ र जटिल प्रम्प्टहरूमा उत्कृष्ट प्रदर्शन गरेको छ, लागत-प्रभावी २.० फ्ल्यास-लाइट, र सोच-बृद्धि गरिएको संस्करण २.० फ्ल्यास थिंकिङ।
सबै वर्गमा जेमिनी २.० प्रो पहिलो स्थानमा छ। कोडिङ, गणित र पजलहरूमा जेमिनी-२.०-फ्ल्यास शीर्ष तीनमा छ। सबै वर्गमा फ्ल्यास-लाइट शीर्ष दसमा छ।


तीन मोडेलहरूको क्षमताहरूको तुलनात्मक चार्ट:

सबै मोडेलहरूले मल्टिमोडल इनपुट र आउटपुट टेक्स्टलाई समर्थन गर्छन्।
थप मोडल क्षमताहरू आउँदैछन्। कोडिङ क्षेत्रमा मोडेल शक्ति चार्ट

विन रेट हीट नक्सा

गुगलले ओपनएआईले भन्दा नि:शुल्क प्रयोगकर्ताहरूलाई राम्रो व्यवहार गर्छ प्लस प्रयोगकर्ताहरूलाई। एआई स्टुडियोमा जेमिनी २.० प्रो प्रयोगात्मकमा नि:शुल्क पहुँच:

Deepseek सेवाले सधैं त्रुटि पर्खाइ प्रदर्शन गर्दछ... याद गर्नुहोस् कि पहिलो अनुमान-मुक्त मोडेल पनि २.० फ्ल्यास थिंकिङ थियो, जुन गुगल एस्टुडियोमा प्रयोग गरिएको थियो।

यसको अतिरिक्त, त्यहाँ छ जेमिनीको वेब संस्करण:
त्यहाँ एक जोडिएको अनुमान मोडेल पनि छ (त्यसो भए यसलाई किन अलग गर्ने...)

गुगलले जेमिनी २.० प्रोको प्रयोगात्मक संस्करण जारी गर्यो, र आधिकारिक बेन्चमार्क परीक्षणहरूमा भएको सुधार एकदमै आकर्षक छ।

यसमा सबैभन्दा शक्तिशाली कोडिङ क्षमताहरू र जटिल प्रम्प्टहरू प्रशोधन गर्ने क्षमता छ, र गुगलले अहिलेसम्म जारी गरेको कुनै पनि मोडेल भन्दा विश्व ज्ञान बुझ्ने र तर्क गर्ने राम्रो क्षमता छ।
यसमा सबैभन्दा ठूलो सन्दर्भ विन्डो छ (२००k, र मेरो लामो सन्दर्भ जेमिनी मोडेलको अपेक्षाकृत ठूलो फाइदा हो), जसले यसलाई ठूलो मात्रामा जानकारीको व्यापक विश्लेषण र बुझ्न, र गुगल खोज र कोड कार्यान्वयन जस्ता उपकरणहरू कल गर्न सक्षम बनाउँछ।
गणित परीक्षणमा, यसले ९१.८१TP11T हासिल गर्यो, जुन संस्करण १.५ भन्दा लगभग ५ प्रतिशत अंकले वृद्धि हो। GPQA तर्क क्षमता ६४.७१TP11T पुग्यो, र SimpleQA विश्व ज्ञान परीक्षणले ४४.३१TP11T पनि पुग्यो।
सबैभन्दा उल्लेखनीय भनेको प्रोग्रामिङ क्षमता हो। यसले LiveCodeBench परीक्षणमा ३६.०१TP११T हासिल गर्यो, र Bird-SQL रूपान्तरण शुद्धता ५९.३१TP११T नाघेको थियो। २० लाख टोकनहरूको सुपर-ठूलो सन्दर्भ विन्डोसँग जोडिएको, यो सबैभन्दा जटिल कोड विश्लेषण कार्यहरू ह्यान्डल गर्न पर्याप्त छ।

तपाईं यसलाई कर्सरमा प्रयास गर्न सक्नुहुन्छ।
बहु-भाषा बुझ्ने क्षमता पनि प्रभावशाली छ, जसको विश्वव्यापी MMLU परीक्षण स्कोर ८६.५१TP११T छ। छवि बुझ्ने MMMU ७२.७१TP११T छ, र भिडियो विश्लेषण क्षमता ७१.९१TP११T छ।
जेमिनी २.० फ्ल्यास-लाइट एउटा रोचक सन्तुलन हो।
यसले १.५ फ्ल्यासको गति र लागत कायम राख्छ, तर राम्रो प्रदर्शन ल्याउँछ। १० लाख टोकन भएको सन्दर्भ विन्डोले यसलाई थप जानकारी प्रशोधन गर्न अनुमति दिन्छ।
सबैभन्दा व्यावहारिक कुरा यसको मूल्य/प्रदर्शन अनुपात हो: ४०,००० तस्बिरहरूको लागि क्याप्सन उत्पादन १TP१२T१ भन्दा कम खर्च लाग्छ। यसले एआईलाई अझ व्यावहारिक बनाउँछ।

ब्लगर श्रीवास्तवले उल्लेख गरे: जेमिनी २.० प्रो इन्कोडिङ पागलपन हो!
सुझाव: सौर्यमण्डल सिमुलेशन सिर्जना गर्न Three.js प्रयोग गर्नुहोस्। समय स्केल, फोकस ड्रप-डाउन मेनु थप्नुहोस्, कक्षाहरू देखाउनुहोस् र लेबलहरू देखाउनुहोस्। सबै कुरा एउटै फाइलमा सिर्जना गर्नुहोस् ताकि म यसलाई अनलाइन सम्पादकमा टाँस्न सकूँ र आउटपुट हेर्न सकूँ।

यसको अतिरिक्त, केही प्रयोगकर्ताहरूले उल्लेख गरे कि जेमिनी २.० फ्ल्यासले आफ्नै विरोधाभास परीक्षणहरू मध्ये एकमा राम्रो नतिजा ल्यायो:

अन्तमा, गुगलले उल्लेख गर्यो कि जेमिनी २.० को सुरक्षा, केवल प्याच मात्र होइन, सुरुदेखि नै डिजाइनको मूलमा रहेको छ।
मोडेललाई आत्म-आलोचनात्मक हुन सिकाउनुहोस्। मिथुनलाई आफ्नै उत्तरहरूको मूल्याङ्कन गर्न र थप सटीक प्रतिक्रिया प्रदान गर्न सुदृढीकरण सिकाइ प्रयोग गर्नुहोस्। यसले संवेदनशील विषयहरूसँग व्यवहार गर्दा यसलाई अझ बलियो बनाउँछ।
स्वचालित रातो टोली परीक्षण रोचक छ। यो विशेष गरी अप्रत्यक्ष प्रम्प्ट शब्दहरूको इंजेक्शन रोक्नको लागि डिजाइन गरिएको हो, जुन डेटामा कसैलाई दुर्भावनापूर्ण आदेशहरू लुकाउनबाट रोक्नको लागि एआईलाई प्रतिरक्षा प्रणालीले सुसज्जित गर्नु जस्तै हो।