
Die storie van Geminek 2.0 besig is om te versnel.
Die Flash Thinking Experimental-weergawe in Desember het ontwikkelaars 'n werkende model met lae latensie en hoë werkverrigting gebring.
Vroeër vanjaar is 2.0 Flash Thinking Experimental in die Google AI Studio opgedateer om werkverrigting verder te verbeter deur die spoed van Flash met verbeterde afleidingsvermoëns te kombineer.
Verlede week is die opgedateerde weergawe 2.0 Flash volledig op die Gemini-rekenaar- en mobiele toepassings bekendgestel.
Vandag is drie nuwe lede terselfdertyd onthul: die eksperimentele weergawe van Gemini 2.0 Pro, wat tot dusver die beste gevaar het in kodering en komplekse opdragte, die kostedoeltreffende 2.0 Flash-Lite, en die denkverbeterde weergawe 2.0 Flash Thinking.
Gemini 2.0 Pro is eerste in alle kategorieë. Gemini-2.0-Flash is onder die top drie in kodering, wiskunde en legkaarte. Flash-lite is in die top tien in alle kategorieë.


'n Vergelykingskaart van die drie modelle se vermoëns:

Alle modelle ondersteun multimodale invoer- en uitvoerteks.
Meer modale vermoëns is op pad. Modelsterktekaart in die koderingsarena

Wentempo hittekaart

Google behandel gratis gebruikers beter as wat OpenAI Plus-gebruikers behandel. Gratis toegang tot Gemini 2.0 Pro Experimental in AI Studio:

Deepseek-diens wys altyd 'n fout wat wag ... Onthou dat die eerste afleidingsvrye model ook 2.0 Flash Thinking was, wat in Google aistudio gebruik is.

Daarbenewens is daar die web weergawe van Gemini:
Daar is ook 'n gekoppelde afleidingsmodel (so hoekom skei dit ...)

Google het die eksperimentele weergawe van Gemini 2.0 Pro vrygestel, en die verbetering in amptelike maatstaftoetse is nogal opvallend.

Dit het die kragtigste koderingsvermoëns en die vermoë om komplekse opdragte te verwerk, en het 'n beter vermoë om wêreldkennis te verstaan en te redeneer as enige model wat tot dusver deur Google vrygestel is.
Dit het die grootste konteksvenster (200k, en my lang konteks is 'n relatief groot voordeel van die Gemini-model), wat dit in staat stel om 'n groot hoeveelheid inligting omvattend te ontleed en te verstaan, en om nutsmiddels soos Google-soektog en kode-uitvoering te bel.
In die MATH-toets het dit 91.8% behaal, 'n toename van ongeveer 5 persentasiepunte teenoor weergawe 1.5. GPQA-redenasievermoë het 64.7% bereik, en SimpleQA-wêreldkennistoets het selfs 44.3% bereik.
Die mees opvallende is die programmeringsvermoë. Dit het 36.0% in die LiveCodeBench-toets behaal, en die Bird-SQL-omskakelingsakkuraatheid het 59.3% oorskry. Tesame met die supergroot konteksvenster van 2 miljoen tokens, is dit genoeg om die mees komplekse kode-ontledingstake te hanteer.

Jy kan dit met die wyser probeer.
Die meertalige begripsvermoë is ook indrukwekkend, met 'n Global MMLU-toetstelling van 86.5%. Beeldbegrip MMMU is 72.7%, en video-ontledingsvermoë is 71.9%.
Gemini 2.0 Flash-Lite is 'n interessante balans.
Dit handhaaf die spoed en koste van 1,5 Flash, maar bring beter werkverrigting. Die konteksvenster met 1 miljoen tokens laat dit toe om meer inligting te verwerk.
Die mees praktiese ding is die prys/prestasie-verhouding: die generering van byskrifte vir 40 000 foto's kos minder as $1. Dit maak KI meer plat op die aarde.

Blogger Shrivastava het genoem: Gemini 2.0 Pro-enkodering is mal!
Wenk: gebruik Three.js om 'n sonnestelselsimulasie te skep. Voeg 'n tydskaal, 'n fokus-aftrekkieslys by, wys wentelbane en wys etikette. Skep alles in een lêer sodat ek dit in 'n aanlynredigeerder kan plak en die uitvoer kan bekyk.

Daarbenewens het sommige gebruikers genoem dat Gemini 2.0 Flash beter resultate gelewer het in een van sy eie paradokstoetse:

Ten slotte het Google genoem dat die sekuriteit van Gemini 2.0, nie net die pleister nie, van die begin af die kern van die ontwerp is.
Laat die model leer om selfkrities te wees. Gebruik versterkingsleer om Tweeling sy eie antwoorde te laat evalueer en meer akkurate terugvoer te gee. Dit maak dit meer robuust wanneer jy met sensitiewe onderwerpe handel.
Die outomatiese rooispantoetsing is interessant. Dit is spesifiek ontwerp om die inspuiting van indirekte vinnige woorde te voorkom, wat is soos om die KI toe te rus met 'n immuunstelsel om te verhoed dat iemand kwaadwillige opdragte in die data wegsteek.