The Google Gemini 2.0 familia este în sfârșit completă! Domină topurile de îndată ce este lansat.
În mijlocul urmăririi și blocajelor de Deepseek, Qwen și o3, Google a lansat trei modele dintr-o singură mișcare în această dimineață devreme: Gemini 2.0 Pro, Gemini 2.0 Flash și Gemini 2.0 Flash-Lite.

În clasamentul modelului mare LMSYS, Gemini 2.0-Pro a ajuns în top, iar familia Gemini-2.0 a avansat cu toții în top 10.

Să ne uităm mai întâi la performanța modelului
The Modele Gemini 2.0 lansate de data aceasta, toate au propriile lor puncte importante în ceea ce privește performanța!

Gemini 2.0 Pro (experimental)
Ca model emblematic din seria Gemini, versiunea Pro reprezintă cele mai avansate capacități AI ale Google și excelează codificare și inferență în special:
- Fereastra de context foarte mare: suportă procesarea contextului de până la 2 milioane de jetoane
- Integrare puternică a instrumentelor: integrează profund căutarea Google și execuția codului
- Disponibilitate: deja disponibil ca versiune experimentală pe Google AI Studio, Vertex AI și platforma Gemini Advanced

Gemini 2.0 Flash
este pozitionat ca a „cal de bataie foarte eficient”. Este proiectat cu accent pe echilibrarea vitezei și performanței și este destinat să ofere suport ideal pentru scenariile de aplicații care necesită răspunsuri cu latență scăzută:
- Milioane de ferestre de context: Suportă contextul de 1 milion de jetoane
- Capacități excelente de inferență multimodală: Bun la procesarea datelor multimodale, în prezent acceptă introducerea multimodală și introducerea textului unimodal
- Extindere viitoare a caracteristicilor: Funcțiile de generare de imagini și de transformare a textului în vorbire vor fi disponibile în curând
- Disponibilitate: Lansat oficial pe platformele Vertex AI Studio și Google AI Studio și poate fi accesat prin API-ul Gemini.
Gemini 2.0 Flash-Lite (previzualizare)
Fiind „cel mai rentabil” model, Flash-Lite oferă cel mai bun echilibru între viteză, cost și performanță.
- Avantaje rentabile: deși menține aceeași viteză și cost ca 1,5 Flash, depășește 1,5 Flash în majoritatea testelor de referință.
- Fereastra de context la nivel de milion: De asemenea, acceptă 1 milion de jetoane de putere de procesare a contextului.
Conform comparației de evaluare a performanței lansată de Google, versiunea Gemini 2.0 Pro Experimental a obținut cele mai mari scoruri la aproape toate testele de referință, performând excelent:

A avut rezultate deosebit de bune în sarcinile de generare a codului (cum ar fi LiveCodeBench v5) și problemele matematice complexe (cum ar fi algebra, geometria și calculul). În plus, a existat o îmbunătățire semnificativă a testului de înțelegere a documentelor lungi și complexe.
Și prețul
Google este, de asemenea, un producător conștiincios în ceea ce privește rentabilitatea API-ului.

Milionul de jetoane Gemini 2.0 Flash costă mai puțin de un dolar... Acceptă moduri multiple, căutări în rețea și o fereastră de context fără precedent.
În schimb, Deepseek V3 costă în prezent un dolar pentru un milion de jetoane, iar inferența R1 costă patru dolari.

PS: Dar tot vreau să-i mulțumesc lui DeepSeek pentru că a scăzut prețul. Oricine poate reduce prețul este familia.
Acesta este într-adevăr prea ieftin! Față de performanță, cred că ceea ce Gemeni a fost trecut cu vederea este prețul!
Performanța carcasei
Deoarece pretinde că este la fel de bun ca Deepseek, trebuie să vedem cu siguranță cum funcționează de fapt în cazuri și să vedem cum l-au testat diverși internauți.
Un joc de pinball bazat pe fizică
Să ne uităm mai întâi la acest caz popular, care folosește un motor fizic pentru a simula efecte realiste, cum ar fi coliziuni, frecare și gravitație.
Sugestie: scrieți un program Python care afișează o minge care sare în interiorul unui hexagon rotativ. Mingea ar trebui să fie afectată de gravitație și frecare și trebuie să sară în mod realist de pe pereții rotativi
Iată cum funcționează Deepseek R1 și o3-min:

Versiunea generată de Gemini 2.0 Pro Experimental:

Celelalte doua modele nu functioneaza bine
Dubla dificultatea! Faceți mingea împărțită în 100 de bile!
Sugestie: scrieți un scenariu pentru 100 de bile galbene strălucitoare care săritură în interiorul unei sfere, asigurându-vă că gestionați corect detectarea coliziunilor. Faceți sfera să se rotească încet. Asigurați-vă că bilele rămân în interiorul sferei. Implementați în p5.js

Bine făcut! Rotirea lentă a sferei este foarte lină, iar simularea legilor fizice este excelentă. Cele 100 de bile se ciocnesc, de asemenea, în mod constant și „își fac treaba” ~
Scrieți un script p5.js pentru a simula 25 de particule care sară într-un spațiu vid în interiorul unui container cilindric. Folosește o culoare diferită pentru fiecare minge și asigură-te că lasă o urmă pentru a-și arăta mișcarea. Adăugați o rotație lentă a recipientului pentru a observa mai bine ce se întâmplă în scenă. Asigurați-vă că ați creat reguli adecvate de detectare a coliziunilor și de fizică pentru a vă asigura că particulele rămân în interiorul recipientului. Adăugați un recipient sferic extern. Adăugați un efect de mărire și micșorare lent întregii scene.

O întrebare de test de căpșuni care nu poate fi ocolită
Și internauții inteligenți (sprețuiți) au renunțat din nou la clasicul test de căpșuni:
Câte r-uri sunt în căpșuni

Și Gemini 2.0 Flash Thinking Experimental a primit răspunsul corect:

Seful Google Jeff Dean și-a testat personal abilitățile de programare
Jeff Dean, om de știință șef la Google DeepMind și Google Research, a testat, de asemenea, abilitățile de programare ale unui val de Gemini 2.0 Pro:

El a pus modelul să completeze clasicul joc Boggle, iar codul generat prima dată a fost finalizat găsind toate cuvintele valide în „pătrat cu litere” joc:

Mai mult, Jeff Dean a spus că codul s-a finalizat în doar 18,9 secunde, ceea ce este foarte rapid.

CEO-ul Google DeepMind este plin de încredere în această actualizare majoră a modelului, spunând că această ediție pune bazele pentru ca Google să realizeze viitorul agent inteligent:

CEO-ul Google, Sundar Pichai, a precizat anterior că 2025 va fi o perioadă critică pentru ca Google să accelereze dezvoltarea în domeniul AI. Se simte ca după această lansare, traseul Google este mai clar!
În comparație cu rutele altor giganți, traseul AI al Google se concentrează mai mult pe caracter practic și oferă direct mai multe opțiuni de versiune, la fel ca o cutie de instrumente AI, unde puteți alege și alege după cum doriți, în funcție de nevoile dvs., flexibilă și convenabilăși capabil să răspundă tuturor nevoilor.