The Google Gemini 2.0 rodzina jest w końcu kompletna! Dominuje na listach przebojów zaraz po wydaniu.
Pośród pościgu i blokad Deepseek, Qwen i o3, Google wypuściło dziś rano trzy modele naraz: Gemini 2.0 Pro, Gemini 2.0 Flash i Gemini 2.0 Flash-Lite.

W rankingu dużych modeli LMSYS, Gemini 2.0-Pro znalazło się na szczycie, a cała rodzina Gemini-2.0 awansowała do pierwszej dziesiątki.

Przyjrzyjmy się najpierw wydajności modelu
The Modele Gemini 2.0 wszystkie wydane tym razem mają swoje własne zalety pod względem wydajności!

Gemini 2.0 Pro (eksperymentalny)
Jako model flagowy z serii Gemini, wersja Pro reprezentuje najbardziej zaawansowane możliwości sztucznej inteligencji firmy Google i wyróżnia się kodowanie i wnioskowanie zwłaszcza:
- Bardzo duże okno kontekstowe: obsługuje przetwarzanie kontekstowe do 2 mln tokenów
- Potężna integracja narzędzi: głęboko integruje wyszukiwanie Google i wykonywanie kodu
- Dostępność: dostępna już jako wersja eksperymentalna w Google AI Studio, Vertex AI i na platformie Gemini Advanced

Gemini 2.0 Flash
jest pozycjonowany jako „wysoce wydajny koń roboczy”. Został zaprojektowany z naciskiem na równowagę między szybkością a wydajnością i ma na celu zapewnienie idealnego wsparcia dla scenariuszy aplikacji, które wymagają odpowiedzi o niskim opóźnieniu:
- Miliony okien kontekstowych: Obsługuje kontekst tokenów 1M
- Doskonałe możliwości wnioskowania multimodalnego: Dobrze radzi sobie z przetwarzaniem danych multimodalnych, obecnie obsługuje multimodalne wprowadzanie danych i jednomodalne wprowadzanie tekstu
- Przyszłe rozszerzenia funkcji: Funkcje generowania obrazów i zamiany tekstu na mowę będą wkrótce dostępne
- Dostępność: Oficjalnie wydano na platformach Vertex AI Studio i Google AI Studio. Dostęp do niego można uzyskać za pomocą interfejsu API Gemini.
Gemini 2.0 Flash-Lite (Podgląd)
Jako „najbardziej opłacalny” model, Flash-Lite oferuje najlepszy balans pomiędzy szybkością, ceną i wydajnością.
- Korzyści pod względem kosztów: Przy zachowaniu tej samej szybkości i kosztów co pamięć Flash 1.5, przewyższa ją w większości testów porównawczych.
- Okno kontekstowe na poziomie miliona: Obsługuje również 1M tokenów mocy przetwarzania kontekstowego.
Zgodnie z porównaniem oceny wydajności opublikowanym przez Google, wersja eksperymentalna Gemini 2.0 Pro osiągnęła najwyższe wyniki w niemal wszystkich testach porównawczych, osiągając znakomite wyniki:

Szczególnie dobrze radził sobie z zadaniami generowania kodu (takimi jak LiveCodeBench v5) i złożonymi problemami matematycznymi (takimi jak algebra, geometria i rachunek różniczkowy). Ponadto nastąpiła znacząca poprawa w teście rozumienia złożonych, długich dokumentów.
I ceny
Google jest również producentem świadomym kosztów tworzenia interfejsu API.

Milion tokenów Gemini 2.0 Flash kosztuje mniej niż jednego dolara… Obsługuje wiele trybów, wyszukiwanie sieciowe i niespotykane dotąd okno kontekstowe.
Dla porównania, Deepseek V3 kosztuje obecnie jednego dolara za milion tokenów, a wnioskowanie R1 kosztuje cztery dolary.

PS: Ale nadal chcę podziękować DeepSeek za obniżenie ceny. Każdy, kto może obniżyć cenę, jest rodziną.
To jest naprawdę za tanie! W porównaniu do wydajności, myślę, że Gemini przeoczyło cenę!
Wydajność obudowy
Ponieważ twierdzi, że jest tak dobry jak Deepseek, zdecydowanie musimy sprawdzić, jak faktycznie działa w różnych przypadkach i zobaczyć, jak różni internauci go testowali
Gra typu pinball oparta na fizyce
Przyjrzyjmy się najpierw temu popularnemu przypadkowi, w którym wykorzystano silnik fizyczny do symulacji realistycznych efektów, takich jak zderzenia, tarcie i grawitacja.
Wskazówka: Napisz program w Pythonie, który wyświetla piłkę odbijającą się wewnątrz obracającego się sześciokąta. Piłka powinna być pod wpływem grawitacji i tarcia i musi odbijać się realistycznie od obracających się ścian
Oto jak działają Deepseek R1 i o3-min:

Wersja wygenerowana przez Gemini 2.0 Pro Experimental:

Pozostałe dwa modele nie działają dobrze
Podwójna trudność! Podziel piłkę na 100 kulek!
Wskazówka: Napisz skrypt dla 100 odbijających się jasnożółtych piłek wewnątrz kuli, upewniając się, że prawidłowo obsługujesz wykrywanie kolizji. Spraw, aby kula obracała się powoli. Upewnij się, że piłki pozostają wewnątrz kuli. Zaimplementuj w p5.js

Dobra robota! Powolny obrót kuli jest bardzo płynny, a symulacja praw fizyki jest doskonała. 100 piłek również zderza się ze sobą w sposób ciągły i „wykonuje swoje zadania” ~
Napisz skrypt p5.js, aby symulować 25 cząsteczek odbijających się w przestrzeni próżniowej wewnątrz cylindrycznego pojemnika. Użyj innego koloru dla każdej kuli i upewnij się, że pozostawiają ślad, aby pokazać swój ruch. Dodaj powolny obrót pojemnika, aby lepiej obserwować, co dzieje się w scenie. Upewnij się, że utworzyłeś odpowiednie wykrywanie kolizji i reguły fizyki, aby upewnić się, że cząsteczki pozostaną wewnątrz pojemnika. Dodaj zewnętrzny sferyczny pojemnik. Dodaj powolny efekt powiększania i pomniejszania do całej sceny.

Pytanie testowe z truskawkami, którego nie da się ominąć
A sprytni (chytrzy) internauci znów odrzucili klasyczny test truskawkowy:
Ile r jest w truskawce?

I Gemini 2.0 Flash Thinking Experimental udzielił prawidłowej odpowiedzi:

Szef Google Jeff Dean osobiście sprawdził jego umiejętności programistyczne
Jeff Dean, główny naukowiec w Google DeepMind i Google Research, również przetestował umiejętności programistyczne fali Gemini 2.0 Pro:

Kazał modelowi ukończyć klasyczną grę Boggle, a wygenerowany kod za pierwszym razem znalazł wszystkie prawidłowe słowa w „litera kwadratowa” gra:

Co więcej, Jeff Dean stwierdził, że ukończenie kodu zajęło zaledwie 18,9 sekundy, co jest bardzo szybkim wynikiem.

Dyrektor generalny Google DeepMind jest pełen wiary w tę znaczącą aktualizację modelu, twierdząc, że ta wersja stanowi podstawę, na której Google będzie mogło skupić się na przyszłych pracach nad inteligentnymi agentami:

Dyrektor generalny Google Sundar Pichai wcześniej jasno dał do zrozumienia, że rok 2025 będzie dla Google okresem krytycznym, jeśli chodzi o przyspieszenie rozwoju w dziedzinie AI. Wydaje się, że po tej wersji droga Google'a stała się jaśniejsza!
W porównaniu do tras innych gigantów, trasa AI Google’a skupia się bardziej na praktyczności i bezpośrednio udostępnia wiele opcji wersji, tak jak skrzynka z narzędziami AI, z której możesz wybierać według własnych upodobań, zgodnie ze swoimi potrzebami, elastycznie i wygodniei jest w stanie sprostać wszelkim potrzebom.