बड़े AI मॉडल का उपयोग करने की उच्च लागत एक प्रमुख कारण है कि कई AI अनुप्रयोगों को अभी तक लागू और प्रचारित नहीं किया गया है। चरम प्रदर्शन का चयन करने का मतलब है विशाल कंप्यूटिंग शक्ति लागत, जो उच्च उपयोग लागतों की ओर ले जाती है जिसे सामान्य उपयोगकर्ता स्वीकार नहीं कर सकते।
बड़े AI मॉडल के लिए प्रतिस्पर्धा धुएँ के बिना युद्ध की तरह है। DeepSeek द्वारा नवीनतम R1 बड़े मॉडल को रिलीज़ करने और ओपन सोर्स करने के बाद, OpenAI ने भी दबाव में अपना नवीनतम o3 मॉडल जारी किया। बड़े मॉडल प्लेयर Google को भी कम लागत वाले मॉडल के लिए भयंकर प्रतिस्पर्धा में शामिल होना पड़ा।
गूगल का नया कदम: जेमिनी श्रृंखला के नए सदस्यों का अनावरण
6 फरवरी की सुबह, गूगल ने जेमिनी मॉडल के नए संस्करणों की एक श्रृंखला लॉन्च की। उनमें से, जेमिनी मॉडल का प्रायोगिक संस्करण भी शामिल है। मिथुन 2.0 प्रो और जेमिनी 2.0 फ्लैश - लाइट के पूर्वावलोकन संस्करण ने बहुत ध्यान आकर्षित किया, और जेमिनी 2.0 फ्लैश का नवीनतम संस्करण आधिकारिक तौर पर जारी किया गया।
एक नए संस्करण के रूप में, गूगल जेमिनी 2.0 फ्लैश-लाइट की कीमत बहुत ही आकर्षक है, जो प्रति मिलियन टोकन मात्र 0.3 USD है, जो इसे गूगल का अब तक का सबसे किफायती मॉडल बनाता है।
दूसरी ओर, जेमिनी 2.0 प्रो के प्रायोगिक संस्करण में शक्तिशाली मूल मल्टीमॉडल क्षमताएं हैं जो पाठ और ऑडियो और वीडियो के बीच रूपांतरण कर सकती हैं।
जेमिनी 2.0 फ्लैश थिंकिंग का प्रायोगिक संस्करण उपयोग के लिए निःशुल्क है और इसमें यूट्यूब वीडियो की सामग्री तक पहुंचने, उसे निकालने और सारांशित करने की क्षमता भी है।
गूगल एआई स्टूडियो उत्पादों के प्रमुख लोगान किलपैट्रिक ने एक्स प्लेटफॉर्म पर घोषणा की कि ये मॉडल "गूगल के इतिहास में सबसे शक्तिशाली मॉडल" हैं और सभी डेवलपर्स के लिए उपलब्ध हैं।
लीडरबोर्ड में नए जेमिनी मॉडल का प्रभावशाली प्रदर्शन और परिणाम
चैटबॉट एरिना लार्ज मॉडल लीडरबोर्ड में, जेमिनी 2.0 फ्लैश थिंकिंग एक्सपेरीमेंटल एडिशन और जेमिनी 2.0 प्रो एक्सपेरीमेंटल एडिशन ने बेहतरीन नतीजे हासिल किए हैं। पिछले Google लार्ज मॉडल की तुलना में, जेमिनी 2.0 ने शानदार प्रगति की है, और आश्चर्य की बात नहीं है कि वे सफलतापूर्वक लीडरबोर्ड के शीर्ष पर पहुंच गए हैं, जिसका संयुक्त स्कोर चैटजीपीटी-4o और DeepSeek-R1 से आगे निकल गया है। यह एक बहुत बड़ा सुधार है।
यह परिणाम गणित, कोडिंग और बहुभाषी प्रसंस्करण सहित विभिन्न क्षेत्रों में बड़े मॉडलों की क्षमताओं के व्यापक मूल्यांकन पर आधारित है।
कीमत और प्रदर्शन: जेमिनी 2.0 के प्रत्येक संस्करण के अपने फायदे हैं
जेमिनी 2.0 के विभिन्न संस्करणों की कीमत और प्रदर्शन के मामले में अपनी अलग-अलग विशेषताएं हैं। प्रदर्शन और कीमत के बीच संतुलन हासिल किया गया है, जिससे उपयोगकर्ताओं को अधिक विकल्प मिलते हैं। जेमिनी 2.0 के विभिन्न संस्करणों के API को Google AI स्टूडियो और वर्टेक्स AI के माध्यम से कॉल किया जा सकता है। डेवलपर्स और उपयोगकर्ता अपनी ज़रूरतों के हिसाब से उपयुक्त संस्करण चुन सकते हैं।
जेमिनी 2.0 ने जेमिनी 1.5 की तुलना में बहुत प्रगति और विकास किया है। हालाँकि जेमिनी 2.0 के विभिन्न संस्करणों में अंतर हैं, लेकिन उनमें समग्र रूप से सुधार किया गया है। विशेष रूप से, आपको उस परिदृश्य को निर्धारित करने की आवश्यकता है जिसका आप उपयोग कर रहे हैं, और फिर आप अपने लिए उपयुक्त जेमिनी मॉडल को बेहतर ढंग से चुन सकते हैं।
कीमत के मामले में, जेमिनी 2.0 फ्लैश और जेमिनी 2.0 फ्लैश - लाइट हल्के वजन की तैनाती पर ध्यान केंद्रित करते हैं। वे संदर्भ विंडो की लंबाई में 1 मिलियन टोकन तक का समर्थन करते हैं, और मूल्य निर्धारण के मामले में, जेमिनी 1.5 फ्लैश में लंबे और छोटे टेक्स्ट प्रोसेसिंग के बीच का अंतर हटा दिया गया है, और कीमत एक इकाई टोकन मूल्य पर एकीकृत है।
जेमिनी 2.0 फ्लैश की लागत टेक्स्ट आउटपुट के लिए प्रति मिलियन टोकन 0.4 USD है, जो लंबे टेक्स्ट को प्रोसेस करते समय जेमिनी 1.5 फ्लैश की कीमत का आधा है।
जेमिनी 2.0 फ्लैश – लाइट बड़े पैमाने पर टेक्स्ट आउटपुट परिदृश्यों में लागत अनुकूलन में और भी बेहतर है, जिसमें टेक्स्ट आउटपुट मूल्य 0.3 USD प्रति मिलियन टोकन है। यहां तक कि Google के सीईओ सुंदर पिचाई ने भी इसकी प्रशंसा करते हुए इसे “कुशल और शक्तिशाली” बताया।
प्रदर्शन सुधार के संदर्भ में, जेमिनी 2.0 फ्लैश में लाइट संस्करण की तुलना में अधिक व्यापक मल्टीमॉडल इंटरैक्शन फ़ंक्शन हैं। यह छवि आउटपुट के साथ-साथ द्विदिशात्मक वास्तविक समय कम विलंबता इनपुट और पाठ, ऑडियो और वीडियो जैसे मोडैलिटी के आउटपुट का समर्थन करने के लिए निर्धारित है।
जेमिनी 2.0 प्रो का प्रायोगिक संस्करण एन्कोडिंग प्रदर्शन और जटिल संकेतों के मामले में उत्कृष्ट है। इसकी संदर्भ विंडो 2 मिलियन टोकन तक पहुंच सकती है, और इसकी सामान्य क्षमता पिछली पीढ़ी की तुलना में 75.8% से बढ़कर 79.1% हो गई है, जो जेमिनी 2.0 फ्लैश और जेमिनी 2.0 फ्लैश - लाइट के साथ एन्कोडिंग और तर्क क्षमता में एक महत्वपूर्ण अंतर है।
जेमिनी एप्लिकेशन टीम ने एक्स प्लेटफॉर्म पर कहा कि जेमिनी एडवांस्ड उपयोगकर्ता मॉडल ड्रॉप-डाउन मेनू के माध्यम से जेमिनी 2.0 प्रो प्रायोगिक संस्करण तक पहुंच सकते हैं, और जेमिनी 2.0 फ्लैश थिंकिंग प्रायोगिक संस्करण जेमिनी एप्लिकेशन उपयोगकर्ताओं के लिए मुफ्त है, और इस संस्करण का उपयोग यूट्यूब, गूगल सर्च और गूगल मैप्स के साथ किया जा सकता है।
प्रतिस्पर्धा का मुकाबला: गूगल मॉडल लागत-प्रभावशीलता प्रतियोगिता
ऐसे समय में जब मॉडल विकास की लागत उद्योग में एक गर्म विषय बन गई है, ओपन सोर्स, कम लागत, उच्च प्रदर्शन DeepSeek - R1 के लॉन्च का पूरे उद्योग पर प्रभाव पड़ा है।
गूगल की चौथी तिमाही 2024 की वित्तीय रिपोर्ट जारी होने के बाद कॉन्फ्रेंस कॉल के दौरान, पिचाई ने DeepSeek की उपलब्धियों को स्वीकार करते हुए इस बात पर भी जोर दिया कि जेमिनी श्रृंखला के मॉडल लागत, प्रदर्शन और विलंबता के बीच संतुलन में अग्रणी हैं और उनका समग्र प्रदर्शन DeepSeek के V3 और R1 मॉडल से बेहतर है।
यांग लिकुन और उनकी टीम द्वारा निर्मित लाइवबेंच बड़े मॉडल प्रदर्शन बेंचमार्क परीक्षण की रैंकिंग के दृष्टिकोण से, जेमिनी 2.0 फ्लैश की समग्र रैंकिंग DeepSeek V3 और ओपनएआई के o1-मिनी से अधिक है, लेकिन यह DeepSeek-R1 और ओपनएआई के o1 से पीछे है। हालाँकि, Google द्वारा जेमिनी 2.0 फ्लैश-लाइट का लॉन्च एक ट्रम्प कार्ड की तरह है। Google को उम्मीद है कि नवीनतम बड़े मॉडल अधिक लोगों के लिए सस्ती हो सकें, उपयोगकर्ताओं की उपयोग लागत कम हो, और कीमत/प्रदर्शन के लिए कंपनियों के बीच प्रतिस्पर्धा में एक स्थान पर कब्जा करने की उम्मीद है।
गूगल द्वारा जारी किये जाने के बाद नवीनतम जेमिनी 2.0, एक नेटिजन ने जेमिनी 2.0 फ्लैश और अन्य लोकप्रिय deepseek और openai GPT-4o मॉडल का अपने आप विश्लेषण करने की कोशिश शुरू की। उन्होंने पाया कि जेमिनी 2.0 फ्लैश का नया संस्करण प्रदर्शन और लागत दोनों के मामले में अन्य दो मॉडलों से बेहतर प्रदर्शन करता है। इससे हमें Google के विकास और विकास की एक झलक भी मिलती है, और यह एक अच्छी शुरुआत है।
खास तौर पर, जेमिनी 2.0 फ्लैश की लागत इनपुट के लिए प्रति मिलियन टोकन 0.1 यूएसडी और आउटपुट के लिए 0.4 यूएसडी है, जो दोनों ही DeepSeek V3 से बहुत कम हैं। यह एक बहुत बड़ा सुधार और विकास है। नेटिजन ने एक्स प्लेटफॉर्म पर यह भी बताया: "जेमिनी 2.0 फ्लैश के आधिकारिक संस्करण की लागत GPT-4o-mini की एक तिहाई है, जबकि यह तीन गुना तेज है।"
बड़े मॉडल बाजार में नया चलन: पैसे का मूल्य ही राजा है
आज, बड़े मॉडल क्षेत्र एक नए मूल्य युद्ध में फंस गया है। अतीत में, बड़े मॉडलों के उपयोग की उच्च लागत ने उनके उपयोग और प्रचार के लिए कुछ प्रतिरोध पैदा किया है। DeepSeek द्वारा ट्रिगर किए गए बड़े मॉडलों के लिए मूल्य युद्ध का विदेशी बड़े मॉडल बाजार पर प्रभाव अभी भी जारी है। इसी समय, ओपन सोर्स विकल्प ने अधिक उपयोगकर्ताओं को नवीनतम बड़े मॉडल अनुसंधान परिणामों को समझने और उनका उपयोग करने की अनुमति भी दी है। ओपन सोर्स + कम कीमत की रणनीति ने कई अमेरिकी बड़ी मॉडल कंपनियों पर भी दबाव डाला है।
गूगल ने जेमिनी 2.0 फ्लैश-लाइट लॉन्च किया, और ओपनएआई ने चैटजीपीटी सर्च फंक्शन को सभी उपयोगकर्ताओं के लिए स्वतंत्र रूप से उपलब्ध कराया, ताकि उपयोगकर्ता अधिक विविध कार्यों को पूरा करने के लिए सर्च फंक्शन का उपयोग कर सकें। मेटा की आंतरिक टीम मेटा के ओपन सोर्स बड़े मॉडलों के आगे के विकास को बढ़ावा देते हुए बड़े मॉडल मूल्य में कमी की रणनीतियों पर शोध को आगे बढ़ा रही है।
इस अत्यधिक प्रतिस्पर्धी क्षेत्र में, कोई भी कंपनी आराम से नंबर एक स्थान पर नहीं बैठ सकती। कंपनियाँ लागत-प्रभावशीलता में सुधार करके उपयोगकर्ताओं को आकर्षित करने और बनाए रखने की कोशिश कर रही हैं। यह प्रवृत्ति बड़े मॉडलों को विशुद्ध प्रौद्योगिकी विकास से व्यापक अनुप्रयोग की ओर ले जाने में मदद करेगी, और भविष्य में बड़े मॉडल बाजार लागत-प्रभावशीलता के लिए प्रतिस्पर्धा में विकसित और बदलना जारी रखेगा।