De Google Gemini 2.0 familie is eindelijk compleet! Het domineert de hitlijsten zodra het uitkomt.
Te midden van de achtervolging en blokkades van Deepseek, Qwen en o3, Google bracht vanmorgen vroeg drie modellen in één keer uit: Gemini 2.0 Pro, Gemini 2.0 Flash en Gemini 2.0 Flash-Lite.

In de LMSYS-ranglijst voor grote modellen is de Gemini 2.0-Pro naar de top geschoten en de hele Gemini-2.0-familie is doorgedrongen tot de top 10.

Laten we eerst eens kijken naar de modelprestaties
De Gemini 2.0-modellen deze keer uitgebracht hebben ze allemaal hun eigen hoogtepunten qua prestaties!

Gemini 2.0 Pro (Experimenteel)
Zoals de vlaggenschipmodel van de Gemini-serie vertegenwoordigt de Pro-versie de meest geavanceerde AI-mogelijkheden van Google en blinkt uit in codering en gevolgtrekking in het bijzonder:
- Extra groot contextvenster: ondersteunt contextverwerking tot 2 miljoen tokens
- Krachtige toolintegratie: integreert Google-zoekopdrachten en code-uitvoering diepgaand
- Beschikbaarheid: al beschikbaar als experimentele versie op Google AI Studio, Vertex AI en het Gemini Advanced-platform

Gemini 2.0 Flash
is gepositioneerd als een “zeer efficiënt werkpaard”Het is ontworpen met een focus op het in evenwicht brengen van snelheid en prestaties, en is bedoeld om ideale ondersteuning te bieden voor toepassingsscenario's die reacties met lage latentie vereisen:
- Miljoenen contextvensters: Ondersteunt 1M tokens-context
- Uitstekende multimodale inferentiemogelijkheden: Goed in het verwerken van multimodale gegevens, ondersteunt momenteel multimodale invoer en enkelvoudige tekstinvoer
- Toekomstige uitbreiding van functies: Binnenkort zijn functies voor het genereren van afbeeldingen en tekst-naar-spraak beschikbaar
- Beschikbaarheid: Officieel uitgebracht op de platforms Vertex AI Studio en Google AI Studio en toegankelijk via de Gemini API.
Gemini 2.0 Flash-Lite (Voorbeeld)
Als het “meest kosteneffectieve” model biedt Flash-Lite de beste balans tussen snelheid, kosten en prestaties.
- Voordelen op het gebied van kosteneffectiviteit: Hoewel de snelheid en kosten gelijk blijven aan die van 1,5 Flash, presteert het in de meeste benchmarktests beter dan 1,5 Flash.
- Contextvenster met miljoenen niveaus: Ondersteunt ook 1M tokens aan contextverwerkingskracht.
Volgens de prestatie-evaluatievergelijking die Google heeft vrijgegeven, behaalde de Gemini 2.0 Pro Experimental-versie de hoogste scores in bijna alle benchmarktests en presteerde uitstekend:

Het presteerde met name goed in codegeneratietaken (zoals LiveCodeBench v5) en complexe wiskundige problemen (zoals algebra, geometrie en calculus). Daarnaast was er een significante verbetering in de test voor het begrijpen van complexe lange documenten.
En de prijsstelling
Google is ook een gewetensvolle fabrikant als het gaat om de kosteneffectiviteit van API's.

De miljoen tokens van Gemini 2.0 Flash kosten minder dan een dollar... Het ondersteunt meerdere modi, netwerkzoekopdrachten en een ongekend contextvenster.
Daarentegen kost Deepseek V3 momenteel één dollar voor een miljoen tokens en kost R1-inferentie vier dollar.

PS: Maar ik wil DeepSeek nog steeds bedanken voor het verlagen van de prijs. Iedereen die de prijs kan verlagen is familie.
Dit is echt te goedkoop! Vergeleken met de prestaties denk ik dat Gemini de prijs over het hoofd heeft gezien!
Case-uitvoering
Omdat het beweert net zo goed te zijn als Deepseek, moeten we zeker zien hoe het in de praktijk presteert en hoe verschillende internetgebruikers het hebben getest.
Een flipperkastspel gebaseerd op natuurkunde
Laten we eerst eens kijken naar deze populaire case, waarbij een physics engine wordt gebruikt om realistische effecten te simuleren, zoals botsingen, wrijving en zwaartekracht.
Tip: Schrijf een Python-programma dat een bal laat zien die stuitert in een roterende zeshoek. De bal moet beïnvloed worden door zwaartekracht en wrijving, en moet realistisch stuiteren van de roterende wanden.
Dit is hoe Deepseek R1 en o3-min presteren:

De versie gegenereerd door Gemini 2.0 Pro Experimental:

De overige twee modellen presteren niet goed
Verdubbel de moeilijkheidsgraad! Laat de bal in 100 ballen splitsen!
Tip: Schrijf een script voor 100 stuiterende felgele ballen in een bol, en zorg ervoor dat je botsingsdetectie correct uitvoert. Laat de bol langzaam roteren. Zorg ervoor dat de ballen in de bol blijven. Implementeer in p5.js

Goed gedaan! De langzame rotatie van de bol is erg soepel en de simulatie van natuurkundige wetten is uitstekend. De 100 ballen botsen ook gestaag en "doen hun werk" ~
Schrijf een p5.js-script om 25 deeltjes te simuleren die rondstuiteren in een vacuümruimte in een cilindrische container. Gebruik een andere kleur voor elke bal en zorg ervoor dat ze een spoor achterlaten om hun beweging te laten zien. Voeg een langzame rotatie van de container toe om beter te kunnen observeren wat er in de scène gebeurt. Zorg ervoor dat u geschikte botsingsdetectie- en fysicaregels maakt om ervoor te zorgen dat de deeltjes in de container blijven. Voeg een externe bolvormige container toe. Voeg een langzaam in- en uitzoomeffect toe aan de hele scène.

Een aardbeientoetsvraag die niet omzeild kan worden
En slimme (sluwe) internetgebruikers hebben de klassieke aardbeientest weer eens in de prullenbak gegooid:
Hoeveel r's zitten er in aardbei?

En Gemini 2.0 Flash Thinking Experimental had het juiste antwoord:

Google-baas Jeff Dean testte persoonlijk zijn programmeervaardigheden
Jeff Dean, hoofdwetenschapper bij Google DeepMind en Google Research, testte ook de programmeervaardigheden van een reeks Gemini 2.0 Pro:

Hij liet het model het klassieke Boggle-spel voltooien en de code die de eerste keer werd gegenereerd, voltooide het vinden van alle geldige woorden in de “letter vierkant” spel:

Bovendien zei Jeff Dean dat de code in slechts 18,9 seconden voltooid was, wat erg snel is.

De CEO van Google DeepMind heeft er alle vertrouwen in dat deze belangrijke update van het model gaat werken. Hij zegt dat deze release de basis legt voor Google om in de toekomst aan intelligente agenten te kunnen werken:

Google CEO Sundar Pichai heeft eerder al duidelijk gemaakt dat 2025 een kritieke periode zal zijn voor Google om de ontwikkeling op het gebied van AI te versnellen. Het voelt alsof na deze release is de koers van Google duidelijker!
Vergeleken met de routes van andere giganten is de AI-route van Google richt zich meer op de praktische kant en biedt direct meerdere versie-opties, net als een AI-toolbox, waar u kunt kiezen en selecteren zoals u wilt, afhankelijk van uw behoeften, flexibel en handigen in staat om aan alle soorten behoeften te voldoen.