गुगलले एकैचोटि तीन नयाँ मोडेलहरू जारी गरेको छ: जेमिनी-२.०-प्रो नि:शुल्क छ, उत्कृष्ट स्कोर छ र पहिलो स्थानमा छ, र जटिल प्रम्प्टहरू कोडिङ र प्रशोधन गर्न उपयुक्त छ!

को कथा जेमी n i २.० तीव्र गतिमा बढिरहेको छ।

डिसेम्बरमा आएको फ्ल्यास थिङ्किङ एक्सपेरिमेन्टल संस्करणले विकासकर्ताहरूलाई कम विलम्बता र उच्च प्रदर्शनको साथ काम गर्ने मोडेल ल्यायो।

यस वर्षको सुरुमा, गुगल एआई स्टुडियोमा २.० फ्ल्यास थिंकिङ एक्सपेरिमेन्टल अपडेट गरिएको थियो जसले गर्दा फ्ल्यासको गतिलाई बढाइएको अनुमान क्षमताहरूसँग संयोजन गरेर कार्यसम्पादनमा थप सुधार गर्न सकियोस्।

गत हप्ता, अपडेट गरिएको संस्करण २.० फ्ल्यास जेमिनी डेस्कटप र मोबाइल एपहरूमा पूर्ण रूपमा लन्च गरिएको थियो।

आज, एकै समयमा तीन नयाँ सदस्यहरू अनावरण गरिएको छ: जेमिनी २.० प्रोको प्रयोगात्मक संस्करण, जसले अहिलेसम्म कोडिङ र जटिल प्रम्प्टहरूमा उत्कृष्ट प्रदर्शन गरेको छ, लागत-प्रभावी २.० फ्ल्यास-लाइट, र सोच-बृद्धि गरिएको संस्करण २.० फ्ल्यास थिंकिङ।

सबै वर्गमा जेमिनी २.० प्रो पहिलो स्थानमा छ। कोडिङ, गणित र पजलहरूमा जेमिनी-२.०-फ्ल्यास शीर्ष तीनमा छ। सबै वर्गमा फ्ल्यास-लाइट शीर्ष दसमा छ।

तीन मोडेलहरूको क्षमताहरूको तुलनात्मक चार्ट:

सबै मोडेलहरूले मल्टिमोडल इनपुट र आउटपुट टेक्स्टलाई समर्थन गर्छन्।

थप मोडल क्षमताहरू आउँदैछन्। कोडिङ क्षेत्रमा मोडेल शक्ति चार्ट

विन रेट हीट नक्सा

गुगलले ओपनएआईले भन्दा नि:शुल्क प्रयोगकर्ताहरूलाई राम्रो व्यवहार गर्छ प्लस प्रयोगकर्ताहरूलाई। एआई स्टुडियोमा जेमिनी २.० प्रो प्रयोगात्मकमा नि:शुल्क पहुँच:

खेल्न क्लिक गर्नुहोस्

Deepseek सेवाले सधैं त्रुटि पर्खाइ प्रदर्शन गर्दछ... याद गर्नुहोस् कि पहिलो अनुमान-मुक्त मोडेल पनि २.० फ्ल्यास थिंकिङ थियो, जुन गुगल एस्टुडियोमा प्रयोग गरिएको थियो।

यसको अतिरिक्त, त्यहाँ छ जेमिनीको वेब संस्करण:

त्यहाँ एक जोडिएको अनुमान मोडेल पनि छ (त्यसो भए यसलाई किन अलग गर्ने...)

गुगलले जेमिनी २.० प्रोको प्रयोगात्मक संस्करण जारी गर्‍यो, र आधिकारिक बेन्चमार्क परीक्षणहरूमा भएको सुधार एकदमै आकर्षक छ।

यसमा सबैभन्दा शक्तिशाली कोडिङ क्षमताहरू र जटिल प्रम्प्टहरू प्रशोधन गर्ने क्षमता छ, र गुगलले अहिलेसम्म जारी गरेको कुनै पनि मोडेल भन्दा विश्व ज्ञान बुझ्ने र तर्क गर्ने राम्रो क्षमता छ।

यसमा सबैभन्दा ठूलो सन्दर्भ विन्डो छ (२००k, र मेरो लामो सन्दर्भ जेमिनी मोडेलको अपेक्षाकृत ठूलो फाइदा हो), जसले यसलाई ठूलो मात्रामा जानकारीको व्यापक विश्लेषण र बुझ्न, र गुगल खोज र कोड कार्यान्वयन जस्ता उपकरणहरू कल गर्न सक्षम बनाउँछ।

गणित परीक्षणमा, यसले ९१.८१TP11T हासिल गर्‍यो, जुन संस्करण १.५ भन्दा लगभग ५ प्रतिशत अंकले वृद्धि हो। GPQA तर्क क्षमता ६४.७१TP11T पुग्यो, र SimpleQA विश्व ज्ञान परीक्षणले ४४.३१TP11T पनि पुग्यो।

सबैभन्दा उल्लेखनीय भनेको प्रोग्रामिङ क्षमता हो। यसले LiveCodeBench परीक्षणमा ३६.०१TP११T हासिल गर्‍यो, र Bird-SQL रूपान्तरण शुद्धता ५९.३१TP११T नाघेको थियो। २० लाख टोकनहरूको सुपर-ठूलो सन्दर्भ विन्डोसँग जोडिएको, यो सबैभन्दा जटिल कोड विश्लेषण कार्यहरू ह्यान्डल गर्न पर्याप्त छ।

तपाईं यसलाई कर्सरमा प्रयास गर्न सक्नुहुन्छ।

बहु-भाषा बुझ्ने क्षमता पनि प्रभावशाली छ, जसको विश्वव्यापी MMLU परीक्षण स्कोर ८६.५१TP११T छ। छवि बुझ्ने MMMU ७२.७१TP११T छ, र भिडियो विश्लेषण क्षमता ७१.९१TP११T छ।

जेमिनी २.० फ्ल्यास-लाइट एउटा रोचक सन्तुलन हो।

यसले १.५ फ्ल्यासको गति र लागत कायम राख्छ, तर राम्रो प्रदर्शन ल्याउँछ। १० लाख टोकन भएको सन्दर्भ विन्डोले यसलाई थप जानकारी प्रशोधन गर्न अनुमति दिन्छ।

सबैभन्दा व्यावहारिक कुरा यसको मूल्य/प्रदर्शन अनुपात हो: ४०,००० तस्बिरहरूको लागि क्याप्सन उत्पादन १TP१२T१ भन्दा कम खर्च लाग्छ। यसले एआईलाई अझ व्यावहारिक बनाउँछ।

ब्लगर श्रीवास्तवले उल्लेख गरे: जेमिनी २.० प्रो इन्कोडिङ पागलपन हो!

सुझाव: सौर्यमण्डल सिमुलेशन सिर्जना गर्न Three.js प्रयोग गर्नुहोस्। समय स्केल, फोकस ड्रप-डाउन मेनु थप्नुहोस्, कक्षाहरू देखाउनुहोस् र लेबलहरू देखाउनुहोस्। सबै कुरा एउटै फाइलमा सिर्जना गर्नुहोस् ताकि म यसलाई अनलाइन सम्पादकमा टाँस्न सकूँ र आउटपुट हेर्न सकूँ।

यसको अतिरिक्त, केही प्रयोगकर्ताहरूले उल्लेख गरे कि जेमिनी २.० फ्ल्यासले आफ्नै विरोधाभास परीक्षणहरू मध्ये एकमा राम्रो नतिजा ल्यायो:

अन्तमा, गुगलले उल्लेख गर्‍यो कि जेमिनी २.० को सुरक्षा, केवल प्याच मात्र होइन, सुरुदेखि नै डिजाइनको मूलमा रहेको छ।

मोडेललाई आत्म-आलोचनात्मक हुन सिकाउनुहोस्। मिथुनलाई आफ्नै उत्तरहरूको मूल्याङ्कन गर्न र थप सटीक प्रतिक्रिया प्रदान गर्न सुदृढीकरण सिकाइ प्रयोग गर्नुहोस्। यसले संवेदनशील विषयहरूसँग व्यवहार गर्दा यसलाई अझ बलियो बनाउँछ।

स्वचालित रातो टोली परीक्षण रोचक छ। यो विशेष गरी अप्रत्यक्ष प्रम्प्ट शब्दहरूको इंजेक्शन रोक्नको लागि डिजाइन गरिएको हो, जुन डेटामा कसैलाई दुर्भावनापूर्ण आदेशहरू लुकाउनबाट रोक्नको लागि एआईलाई प्रतिरक्षा प्रणालीले सुसज्जित गर्नु जस्तै हो।

अवर्गीकृत

२७ वर्षीय सीईओसँग a16z संवाद: एआई एजेन्टको ठूलो लाभ प्रभाव छ, र दीर्घकालीन मूल्य निर्धारण श्रम लागतसँग जोडिएको हुनेछ।

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

हाइलाइटहरू एआई एजेन्टले ग्राहकको अनुभवलाई पुन: आकार दिन्छ जेसी झाङ: एजेन्ट वास्तवमा कसरी निर्माण गरिन्छ? हाम्रो विचार यो छ कि समयसँगै, यो प्राकृतिक भाषा-आधारित एजेन्ट जस्तै हुँदै जानेछ किनभने ठूला भाषा मोडेलहरू (LLMs) लाई यसरी नै तालिम दिइन्छ। लामो अवधिमा, यदि तपाईंसँग एक सुपर बुद्धिमान एजेन्ट छ भने ...

अवर्गीकृत

DeepSeek ले गरेको छ! OpenAI ले बन्द स्रोत गल्ती स्वीकार गर्दछ, अग्रणी किनारा लाभ सानो हुन्छ

द्वाराzddeepseeker फेब्रुअरी २, २०२५फेब्रुअरी २, २०२५

ओपनएआईले o3-मिनी मोडेल जारी गरेपछि, यसका सीईओ साम अल्टम्यान, प्रमुख अनुसन्धान अधिकारी मार्क चेन, प्रमुख उत्पादन अधिकारी केभिन वेइल; इन्जिनियरिङका उपाध्यक्ष श्रीनिवास नारायणन, एपीआई अनुसन्धान प्रमुख मिशेल पोक्रस, र अनुसन्धान प्रमुख होङयु रेनले विश्वको सबैभन्दा ठूलो व्यापक फोरमहरू मध्ये एक, रेडिटमा अनलाइन प्राविधिक प्रश्नोत्तर सञ्चालन गरे। मुख्य विषयहरू…

अवर्गीकृत

ब्रेकिङ न्यूज! DeepSeek अनुसन्धानकर्ताले अनलाइन खुलासा गरे: R1 तालिममा दुई देखि तीन हप्ता मात्र लाग्यो, र चिनियाँ नयाँ वर्षको बिदामा R1 शून्यको शक्तिशाली विकास अवलोकन गरिएको थियो।

द्वाराzddeepseeker फेब्रुअरी ४, २०२५फेब्रुअरी ४, २०२५

ब्रेकिङ न्युज! DeepSeek अनुसन्धानकर्ताले अनलाइन खुलासा गरे: R1 तालिममा दुई देखि तीन हप्ता मात्र लाग्यो, र चिनियाँ नयाँ वर्षको बिदामा R1 शून्यको शक्तिशाली विकास अवलोकन गरिएको थियो। भर्खरै, हामीले याद गर्यौं कि DeepSeek अनुसन्धानकर्ता दया गुओले DeepSeek R1 र कम्पनीको भविष्यको योजनाहरूको बारेमा नेटिजनहरूको प्रश्नहरूको जवाफ दिए। हामी केवल भन्न सक्छौं ...

अवर्गीकृत

DeepSeek R1 रचनात्मक लेखन परीक्षणमा पहिलो आयो, र o3 mini o1 mini भन्दा पनि खराब थियो!

द्वाराzddeepseeker फेब्रुअरी ३, २०२५फेब्रुअरी ३, २०२५

DeepSeek R1 ले क्रिएटिभ लघुकथा लेखन बेन्चमार्क परीक्षणमा च्याम्पियनशिप जित्यो, अघिल्लो प्रभावशाली खेलाडी क्लाउड 3.5 सनेटलाई सफलतापूर्वक पार गर्दै! बेन्चमार्क परीक्षण शोधकर्ता लेच माजुर द्वारा डिजाइन गरिएको बेन्चमार्क परीक्षण तपाईंको औसत लेखन प्रतिस्पर्धा होइन। प्रत्येक एआई मोडेलले 500 छोटो कथाहरू पूरा गर्न आवश्यक थियो, र प्रत्येक कथाले चलाखीपूर्वक समावेश गर्नुपर्थ्यो...

अवर्गीकृत

१TP8T शीर्ष १७ उत्कृष्ट विकल्पहरू: व्यापक विश्लेषण (२०२५)

द्वारा1TP7 टेर फेब्रुअरी ६, २०२५फेब्रुअरी ६, २०२५

परिचय कृत्रिम बुद्धिमत्ताको द्रुत रूपमा विकसित परिदृश्यमा, DeepSeek एक शक्तिशाली भाषा मोडेलको रूपमा देखा परेको छ। यो व्यापक विश्लेषणले DeepSeek का शीर्ष १७ विकल्पहरूको अन्वेषण गर्दछ, तिनीहरूको अद्वितीय सुविधाहरू, क्षमताहरू र प्रयोगका केसहरूको जाँच गर्दछ। हाम्रो अनुसन्धान DeepSeek एकीकरण वा समान क्षमताहरू प्रदान गर्ने अन्तर्राष्ट्रिय र चिनियाँ प्लेटफर्महरू दुवैमा केन्द्रित छ। शीर्ष विकल्प विश्लेषण १….

अवर्गीकृत

OpenAI o3-mini vs. DeepSeek-R1: नयाँ पुस्ताको AI मोडेलको राजा को हो?

द्वाराzddeepseeker फेब्रुअरी १, २०२५फेब्रुअरी १, २०२५

o3-mini यहाँ छ, एक चुनौतीको गति संग जनवरी 31 मा, OpenAI ले एकदम नयाँ o3-mini ठूलो मोडेल जारी गर्यो र सबै ChatGPT प्रयोगकर्ताहरूलाई नि:शुल्क रूपमा यसका केही कार्यहरू प्रदान गर्यो। यद्यपि त्यहाँ प्रश्नहरूको संख्यामा सीमा छ, यसले प्रयोगकर्ताहरूलाई सकेसम्म चाँडो OpenAI को नवीनतम व्यावसायिक मोडेल अनुभव गर्न अनुमति दिन्छ।

समान पोस्टहरू

जवाफ लेख्नुहोस् जवाफ रद्द गर्नुहोस्

जवाफ लेख्नुहोस्