Gemini 2.0 oorheers die kaarte, terwyl DeepSeek V3 huil in sy prys, en 'n nuwe koste-effektiewe kampioen word gebore!

Die Google Gemini 2.0 familie is uiteindelik voltooi! Dit oorheers die kaarte sodra dit vrygestel word.

Te midde van die agtervolging en blokkades van Deepseek, Qwen en o3, het Google vroeg vanoggend drie modelle in een slag vrygestel: Gemini 2.0 Pro, Gemini 2.0 Flash en Gemini 2.0 Flash-Lite.

Op die groot model LMSYS-ranglys het Gemini 2.0-Pro na die top geskiet, en die Gemini-2.0-familie het almal na die top 10 gevorder.

Inhoudsopgawe

Kom ons kyk eers na die modelprestasie

Die Gemini 2.0-modelle wat hierdie keer vrygestel is, het almal hul eie hoogtepunte in terme van prestasie!

Gemini 2.0 Pro (Eksperimenteel)

Soos die vlagskip model van die Gemini-reeks verteenwoordig die Pro-weergawe die mees gevorderde KI-vermoëns van Google, en blink uit in kodering en afleiding in die besonder:

Ekstra groot konteks venster: ondersteun konteksverwerking van tot 2M tekens
Kragtige instrument-integrasie: integreer Google-soektog en kode-uitvoering diep
Beskikbaarheid: reeds beskikbaar as 'n eksperimentele weergawe op Google AI Studio, Vertex AI en die Gemini Advanced-platform

Gemini 2.0 Flash

is geposisioneer as 'n “hoogs doeltreffende werkesel”. Dit is ontwerp met 'n fokus op die balansering van spoed en werkverrigting, en is bedoel om ideale ondersteuning te bied vir toepassingscenario's wat reaksies met 'n lae vertraging vereis:

Miljoene konteksvensters: Ondersteun 1M tokens konteks
Uitstekende multimodale afleidingsvermoëns: Goed met die verwerking van multimodale data, ondersteun tans multimodale invoer en enkelmodale teksinvoer
Toekomstige kenmerkuitbreiding: Beeldgenerering en teks-na-spraak-funksies sal binnekort beskikbaar wees
Beskikbaarheid: Amptelik vrygestel op die Vertex AI Studio- en Google AI Studio-platforms, en kan verkry word via die Gemini API.

Gemini 2.0 Flash-Lite (voorskou)

As die "kostedoeltreffendste" model bied Flash-Lite die beste balans tussen spoed, koste en werkverrigting.

Koste-effektiewe voordele: Alhoewel dit dieselfde spoed en koste as 1,5 Flash handhaaf, vaar dit beter as 1,5 Flash in die meeste maatstaftoetse.
Miljoen-vlak konteks venster: Ondersteun ook 1M tekens van konteksverwerkingskrag.

Volgens die prestasie-evalueringsvergelyking wat deur Google vrygestel is, het die Gemini 2.0 Pro Experimental-weergawe die hoogste tellings in byna alle maatstaftoetse behaal en uitstekend gevaar:

Dit het veral goed gevaar in kodegenereringstake (soos LiveCodeBench v5) en komplekse wiskundige probleme (soos algebra, meetkunde en calculus). Daarbenewens was daar 'n aansienlike verbetering in die toets om komplekse lang dokumente te verstaan.

En die pryse

Google is ook 'n pligsgetroue vervaardiger wat API-kostedoeltreffendheid betref.

Gemini 2.0 Flash se miljoen tokens kos minder as een dollar ... Dit ondersteun verskeie modusse, netwerksoektogte en 'n ongekende konteksvenster.

Daarteenoor kos Deepseek V3 tans een dollar vir 'n miljoen tokens, en R1 afleiding kos vier dollar.

NS: Maar ek wil tog DeepSeek bedank vir die verlaging van die prys. Enigiemand wat die prys kan verlaag, is familie.

Dit is regtig te goedkoop! In vergelyking met die prestasie, dink ek wat Gemini oor die hoof gesien is, is die prys!

Geval prestasie

Aangesien dit beweer dat dit so goed soos Deepseek is, moet ons beslis sien hoe dit werklik in gevalle presteer en kyk hoe verskeie netizens dit getoets het

'n Fisika-gebaseerde flipperspel

Kom ons kyk eers na hierdie gewilde geval, wat 'n fisika-enjin gebruik om realistiese effekte soos botsings, wrywing en swaartekrag te simuleer.

Wenk: Skryf 'n Python-program wat 'n bal vertoon wat binne 'n roterende seshoek bons. Die bal moet deur swaartekrag en wrywing beïnvloed word, en moet realisties van die roterende mure af bons

Dit is hoe Deepseek R1 en o3-min presteer:

Die weergawe gegenereer deur Gemini 2.0 Pro Experimental:

Die oorblywende twee modelle vaar nie goed nie

Verdubbel die moeilikheid! Maak die bal verdeel in 100 balle!

Wenk: Skryf 'n skrif vir 100 bonsende heldergeel balle binne 'n sfeer, en maak seker dat botsingsopsporing korrek hanteer word. Laat die sfeer stadig draai. Maak seker dat die balle binne die sfeer bly. Implementeer in p5.js

Welgedaan! Die stadige rotasie van die sfeer is baie glad, en die simulasie van fisiese wette is uitstekend. Die 100 balle bots ook bestendig en "doen hul werk" ~

Skryf 'n p5.js-skrif om 25 deeltjies te simuleer wat rondbons in 'n vakuumruimte binne 'n silindriese houer. Gebruik 'n ander kleur vir elke bal en maak seker dat hulle 'n spoor agterlaat om hul beweging te wys. Voeg 'n stadige rotasie van die houer by om beter waar te neem wat in die toneel gebeur. Maak seker dat jy toepaslike botsingsopsporing en fisika-reëls skep om te verseker dat die deeltjies in die houer bly. Voeg 'n eksterne sferiese houer by. Voeg 'n stadige in- en uitzoom-effek by die hele toneel.

'n Aarbei toetsvraag wat nie omseil kan word nie

En slim (slinkse) netizens het weer die klassieke aarbeitoets uitgegooi:

Hoeveel r's is daar in aarbei

En Gemini 2.0 Flash Thinking Experimental het die antwoord reg gekry:

Google-baas Jeff Dean het persoonlik sy programmeringsvaardighede getoets

Jeff Dean, hoofwetenskaplike by Google DeepMind en Google Research, het ook die programmeringsvaardighede van 'n golf Gemini 2.0 Pro getoets:

Hy het die model die klassieke Boggle-speletjie laat voltooi, en die kode wat die eerste keer gegenereer is, het alle geldige woorde in die "letter vierkant" speletjie:

Boonop het Jeff Dean gesê dat die kode in slegs 18,9 sekondes voltooi is, wat baie vinnig is.

Die HUB van Google DeepMind is vol vertroue in hierdie groot opdatering van die model en sê dat hierdie vrystelling die grondslag lê vir Google om toekomstige toekomstige intelligente agentwerk te bereik:

Google se uitvoerende hoof, Sundar Pichai, het dit voorheen duidelik gemaak dat 2025 'n kritieke tydperk vir Google sal wees om ontwikkeling op die gebied van KI te versnel. Dit voel soos ná hierdie vrystelling is Google se roete duideliker!

In vergelyking met die roetes van ander reuse, Google se KI-roete fokus meer op praktiese en bied direk verskeie weergawe opsies, net soos 'n KI-gereedskapskis, waar jy kan kies en keur soos jy wil, volgens jou behoeftes, buigsaam en gerieflik, en in staat is om aan alle soorte behoeftes te voldoen.

Gemini 2.0 oorheers die kaarte, terwyl DeepSeek V3 huil in sy prys, en 'n nuwe koste-effektiewe kampioen word gebore!