ठूला एआई मोडेलहरू प्रयोग गर्ने उच्च लागत धेरै एआई अनुप्रयोगहरू अझै कार्यान्वयन र प्रवर्द्धन नगरिनुको प्रमुख कारण हो। चरम प्रदर्शन छनौट गर्नु भनेको ठूलो कम्प्युटिङ पावर लागत हो, जसले गर्दा उच्च उपयोग लागतहरू हुन्छन् जुन सामान्य प्रयोगकर्ताहरूले स्वीकार गर्न सक्दैनन्।
ठूला एआई मोडेलहरूको लागि प्रतिस्पर्धा धुवाँ बिनाको युद्ध जस्तै हो। DeepSeek ले पछिल्लो R1 ठूलो मोडेल जारी गरेपछि र खुला स्रोत बनाएपछि, ओपनएआईले पनि दबाबमा आफ्नै पछिल्लो o3 मोडेल जारी गर्यो। ठूलो मोडेल खेलाडी गुगलले पनि कम लागतका मोडेलहरूको लागि कडा प्रतिस्पर्धामा सामेल हुनुपर्यो।
गुगलको नयाँ चाल: जेमिनी शृङ्खलाका नयाँ सदस्यहरूको अनावरण
फेब्रुअरी ६ को बिहान, गुगलले जेमिनी मोडेलको नयाँ संस्करणहरूको श्रृंखला सुरु गर्यो। ती मध्ये, प्रयोगात्मक संस्करण मिथुन २.० प्रो र जेमिनी २.० फ्ल्यास - लाइटको पूर्वावलोकन संस्करणले धेरै ध्यान आकर्षित गर्यो, र जेमिनी २.० फ्ल्यासको पछिल्लो संस्करण आधिकारिक रूपमा जारी गरियो।
नयाँ संस्करणको रूपमा, गुगल जेमिनी २.० फ्ल्यास – लाइटको प्रति मिलियन टोकनको मूल्य केवल ०.३ अमेरिकी डलर छ, जसले यसलाई गुगलको अहिलेसम्मको सबैभन्दा किफायती मोडेल बनाउँछ।
अर्कोतर्फ, जेमिनी २.० प्रोको प्रयोगात्मक संस्करणमा शक्तिशाली नेटिभ मल्टिमोडल क्षमताहरू छन् जसले पाठ र अडियो र भिडियो बीच रूपान्तरण गर्न सक्छ।
जेमिनी २.० फ्ल्याश थिङ्किङको प्रयोगात्मक संस्करण प्रयोग गर्न नि:शुल्क छ र यसमा युट्युब भिडियोहरूको सामग्री पहुँच गर्ने, निकाल्ने र संक्षेप गर्ने क्षमता पनि छ।
गुगल एआई स्टुडियो उत्पादनका प्रमुख लोगान किलप्याट्रिकले एक्स प्लेटफर्ममा घोषणा गरे कि यी मोडेलहरू "गुगलको इतिहासमा सबैभन्दा शक्तिशाली मोडेलहरू" हुन् र सबै विकासकर्ताहरूका लागि उपलब्ध छन्।
नयाँ जेमिनी मोडेलहरूको प्रभावशाली प्रदर्शन र लिडरबोर्डमा नतिजाहरू
च्याटबोट एरिना लार्ज मोडेल लिडरबोर्डमा, जेमिनी २.० फ्ल्यास थिंकिङ एक्सपेरिमेन्टल एडिसन र जेमिनी २.० प्रो एक्सपेरिमेन्टल एडिसनले उत्कृष्ट नतिजा हासिल गरेका छन्। गुगलका अघिल्ला ठूला मोडेलहरूको तुलनामा, जेमिनी २.० ले ठूलो प्रगति गरेको छ, र अचम्म मान्नु पर्दैन, तिनीहरू सफलतापूर्वक लिडरबोर्डको शीर्षमा पुगेका छन्, संयुक्त स्कोरले ChatGPT-4o र DeepSeek-R1 लाई उछिनेको छ। यो एक ठूलो सुधार हो।
यो नतिजा गणित, कोडिङ, र बहुभाषी प्रशोधन सहित विभिन्न क्षेत्रहरूमा ठूला मोडेलहरूको क्षमताहरूको व्यापक मूल्याङ्कनमा आधारित छ।
मूल्य र कार्यसम्पादन: जेमिनी २.० को प्रत्येक भेरियन्टका आफ्नै फाइदाहरू छन्।
जेमिनी २.० का विभिन्न संस्करणहरूको मूल्य र कार्यसम्पादनको हिसाबले आफ्नै विशेषताहरू छन्। प्रदर्शन र मूल्य बीच सन्तुलन हासिल गरिएको छ, जसले प्रयोगकर्ताहरूलाई थप विकल्पहरू प्रदान गर्दछ। जेमिनी २.० का विभिन्न संस्करणहरूको एपीआईहरू गुगल एआई स्टुडियो र भर्टेक्स एआई मार्फत कल गर्न सकिन्छ। विकासकर्ताहरू र प्रयोगकर्ताहरूले आफ्नो आवश्यकता अनुसार उपयुक्त संस्करण छनौट गर्न सक्छन्।
जेमिनी २.० ले जेमिनी १.५ को तुलनामा धेरै प्रगति र विकास गरेको छ। जेमिनी २.० का विभिन्न संस्करणहरूमा भिन्नता भए पनि, समग्रमा ती सबैमा सुधार गरिएको छ। विशेष गरी, तपाईंले प्रयोग गरिरहनुभएको परिदृश्य निर्धारण गर्न आवश्यक छ, र त्यसपछि तपाईंले आफूलाई उपयुक्त हुने जेमिनी मोडेल राम्रोसँग छनौट गर्न सक्नुहुन्छ।
मूल्यको हिसाबले, जेमिनी २.० फ्ल्यास र जेमिनी २.० फ्ल्यास – लाइटले हल्का तौलमा प्रयोग गर्ने क्षमतामा ध्यान केन्द्रित गर्दछन्। तिनीहरूले सन्दर्भ विन्डोको लम्बाइमा १० लाख टोकनहरू समर्थन गर्छन्, र मूल्य निर्धारणको हिसाबले, जेमिनी १.५ फ्ल्यासमा लामो र छोटो पाठ प्रशोधन बीचको भिन्नता हटाइएको छ, र मूल्य एकाइ टोकन मूल्यमा एकीकृत गरिएको छ।
जेमिनी २.० फ्ल्यासको मूल्य प्रति मिलियन टोकन टेक्स्ट आउटपुटको लागि ०.४ अमेरिकी डलर पर्छ, जुन लामो टेक्स्ट प्रशोधन गर्दा जेमिनी १.५ फ्ल्यासको मूल्यको आधा हो।
जेमिनी २.० फ्ल्यास - लाइट ठूलो मात्रामा टेक्स्ट आउटपुट परिदृश्यहरूमा लागत अनुकूलनको हिसाबले अझ राम्रो छ, प्रति मिलियन टोकन ०.३ अमेरिकी डलरको टेक्स्ट आउटपुट मूल्य निर्धारणको साथ। गुगलका सीईओ सुन्दर पिचाईले पनि यसलाई "कुशल र शक्तिशाली" भनेर प्रशंसा गरे।
कार्यसम्पादन सुधारको सन्दर्भमा, जेमिनी २.० फ्ल्यासमा लाइट संस्करण भन्दा बढी व्यापक बहु-मोडल अन्तरक्रिया प्रकार्यहरू छन्। यसले छवि आउटपुट, साथै पाठ, अडियो, र भिडियो जस्ता मोडालिटीहरूको द्विदिशात्मक वास्तविक-समय कम-विलम्बता इनपुट र आउटपुटलाई समर्थन गर्ने तालिका छ।
जेमिनी २.० प्रोको प्रयोगात्मक संस्करण एन्कोडिङ कार्यसम्पादन र जटिल प्रम्प्टहरूको सन्दर्भमा उत्कृष्ट छ। यसको सन्दर्भ विन्डो २० लाख टोकनसम्म पुग्न सक्छ, र यसको सामान्य क्षमता अघिल्लो पुस्ताको तुलनामा ७५.८१TP११T बाट ७९.११TP११T पुगेको छ, जुन जेमिनी २.० फ्ल्यास र जेमिनी २.० फ्ल्यास – लाइटसँग एन्कोडिङ र तर्क गर्ने क्षमतामा महत्त्वपूर्ण भिन्नता हो।
जेमिनी एप्लिकेसन टोलीले X प्लेटफर्ममा भनेको छ कि जेमिनी एडभान्स्ड प्रयोगकर्ताहरूले मोडेल ड्रप-डाउन मेनु मार्फत जेमिनी २.० प्रो प्रयोगात्मक संस्करण पहुँच गर्न सक्छन्, र जेमिनी २.० फ्ल्यास थिंकिङ प्रयोगात्मक संस्करण जेमिनी एप्लिकेसन प्रयोगकर्ताहरूका लागि नि:शुल्क छ, र यो संस्करण युट्युब, गुगल खोज र गुगल नक्साको संयोजनमा प्रयोग गर्न सकिन्छ।
प्रतिवाद प्रतिस्पर्धा: गुगल मोडेल लागत-प्रभावकारिता प्रतियोगिता
मोडेल विकासको लागत उद्योगमा तातो विषय बनेको समयमा, खुला स्रोत, कम लागत, उच्च प्रदर्शन DeepSeek – R1 को सुरुवातले सम्पूर्ण उद्योगमा प्रभाव पारेको छ।
गुगलको चौथो त्रैमासिक २०२४ को वित्तीय प्रतिवेदन सार्वजनिक भएपछि भएको सम्मेलन कलमा, पिचाईले १TP८T को उपलब्धिहरूलाई स्वीकार गर्दै, जेमिनी शृङ्खलाका मोडेलहरू लागत, कार्यसम्पादन र विलम्बता बीचको सन्तुलनमा अग्रणी रहेको र तिनीहरूको समग्र कार्यसम्पादन १TP८T को V३ र R१ मोडेलहरू भन्दा राम्रो रहेको कुरामा पनि जोड दिए।
याङ लिकुन र उनको टोलीद्वारा निर्मित LiveBench ठूलो मोडेल प्रदर्शन बेन्चमार्क परीक्षणको श्रेणीकरणको दृष्टिकोणबाट, Gemini 2.0 Flash को समग्र श्रेणीकरण DeepSeek V3 र OpenAI को o1 – mini भन्दा उच्च छ, तर यो DeepSeek – R1 र OpenAI को o1 भन्दा पछाडि छ। यद्यपि, Google को Gemini 2.0 Flash – Lite को सुरुवात ट्रम्प कार्ड जस्तै हो। Google ले नवीनतम ठूला मोडेलहरूलाई धेरै मानिसहरूको लागि किफायती बनाउने, प्रयोगकर्ताहरूको प्रयोग लागत घटाउने र मूल्य/प्रदर्शनको लागि कम्पनीहरू बीचको प्रतिस्पर्धामा स्थान ओगट्ने आशा राखेको छ।
गुगलले जारी गरेपछि पछिल्लो जेमिनी २.०, एक नेटिजेनले जेमिनी २.० फ्ल्यास र अन्य लोकप्रिय १TP७T र ओपनई GPT-४o मोडेलहरू आफैं विश्लेषण गर्न थाले। उनले जेमिनी २.० फ्ल्यासको नयाँ संस्करणले प्रदर्शन र लागत दुवैको हिसाबले अन्य दुई मोडेलहरूलाई पछाडि पारेको पाए। यसले हामीलाई गुगलको विकास र विकासको झलक पनि दिन्छ, र यो राम्रो सुरुवात हो।
विशेष गरी, जेमिनी २.० फ्ल्यासको लागत प्रति मिलियन टोकन इनपुटको लागि ०.१ USD र आउटपुटको लागि ०.४ USD छ, जुन दुवै १TP8T V3 भन्दा धेरै कम छन्। यो एक ठूलो सुधार र विकास हो। नेटिजेनले X प्लेटफर्ममा यो पनि औंल्याए: "जेमिनी २.० फ्ल्यासको आधिकारिक संस्करणको लागत GPT-4o-mini को एक तिहाइ छ, जबकि यो तीन गुणा छिटो छ।"
ठूलो मोडेल बजारमा नयाँ प्रवृत्ति: पैसाको लागि मूल्य राजा हो
आज, ठूला मोडेल क्षेत्र नयाँ मूल्य युद्धमा फसेको छ। विगतमा, ठूला मोडेलहरू प्रयोग गर्ने उच्च लागतले तिनीहरूको प्रयोग र प्रवर्द्धनमा केही प्रतिरोध सिर्जना गरेको छ। DeepSeek द्वारा विदेशी ठूला मोडेल बजारमा सुरु भएका ठूला मोडेलहरूको मूल्य युद्धको प्रभाव अझै पनि निरन्तर छ। साथै, खुला स्रोत विकल्पले धेरै प्रयोगकर्ताहरूलाई पछिल्लो ठूला मोडेल अनुसन्धान परिणामहरू बुझ्न र प्रयोग गर्न अनुमति दिएको छ। खुला स्रोत + कम मूल्य रणनीतिले धेरै अमेरिकी ठूला मोडेल कम्पनीहरूमा पनि दबाब दिएको छ।
गुगलले जेमिनी २.० फ्ल्यास-लाइट सुरु गर्यो, र ओपनएआईले च्याटजीपीटी खोज प्रकार्यलाई सबै प्रयोगकर्ताहरूका लागि निःशुल्क रूपमा उपलब्ध गरायो, ताकि प्रयोगकर्ताहरूले थप विविध कार्यहरू पूरा गर्न खोज प्रकार्य प्रयोग गर्न सकून्। मेटाको आन्तरिक टोलीले मेटाको खुला स्रोत ठूला मोडेलहरूको थप विकासलाई प्रवर्द्धन गर्दै ठूला मोडेल मूल्य घटाउने रणनीतिहरूमा अनुसन्धानलाई पनि तीव्र बनाइरहेको छ।
यो अत्यधिक प्रतिस्पर्धात्मक क्षेत्रमा, कुनै पनि कम्पनी नम्बर एक स्थानमा आरामसँग बस्न सक्दैन। कम्पनीहरूले लागत-प्रभावकारिता सुधार गरेर प्रयोगकर्ताहरूलाई आकर्षित गर्न र कायम राख्न प्रयास गरिरहेका छन्। यो प्रवृत्तिले ठूला मोडेलहरूलाई शुद्ध प्रविधि विकासबाट व्यापक अनुप्रयोगमा जान मद्दत गर्नेछ, र भविष्यको ठूलो मोडेल बजार लागत-प्रभावकारिताको लागि प्रतिस्पर्धामा विकसित र परिवर्तन हुँदै जानेछ।