На Google Gemini 2.0 семејството конечно е комплетирано! Доминира на топ листите веднаш штом ќе биде објавен.
Среде потера и блокади на Длабоко барај, Qwen и o3, Google рано утрово објави три модели во едно движење: Gemini 2.0 Pro, Gemini 2.0 Flash и Gemini 2.0 Flash-Lite.

На рангирањето на големиот модел LMSYS, Gemini 2.0-Pro се искачи на врвот, а семејството Gemini-2.0 напредуваше во првите 10.

Ајде прво да ги погледнеме перформансите на моделот
На Модели Gemini 2.0 објавен овој пат, сите имаат свои врвни моменти во однос на перформансите!

Gemini 2.0 Pro (експериментално)
Како што е водечки модел од серијата Gemini, верзијата Pro ги претставува најнапредните способности за вештачка интелигенција на Google и се истакнува во кодирање и заклучување особено:
- Екстра-голем контекстен прозорец: поддржува обработка на контекст до 2M токени
- Моќна интеграција на алатки: длабоко го интегрира пребарувањето на Google и извршувањето на кодот
- Достапност: веќе достапна како експериментална верзија на Google AI Studio, Vertex AI и Gemini Advanced платформата

Близнаци 2.0 блиц
се позиционира како а „Високо ефикасен работен коњ“. Дизајниран е со фокус на балансирање на брзината и перформансите и е наменет да обезбеди идеална поддршка за сценарија за апликации кои бараат одговори со ниска латентност:
- Милиони контекстни прозорци: Поддржува контекст со 1M токени
- Одлични мултимодални способности за заклучување: Добро во обработка на мултимодални податоци, моментално поддржува мултимодално внесување и едномодално внесување текст
- Идно проширување на функциите: Функциите за генерирање слики и текст во говор ќе бидат достапни наскоро
- Достапност: Официјално објавено на платформите Vertex AI Studio и Google AI Studio, а може да се пристапи преку Gemini API.
Gemini 2.0 Flash-Lite (Преглед)
Како „најисплатлив“ модел, Flash-Lite нуди најдобар баланс помеѓу брзината, цената и перформансите.
- Ефективни предности: додека ја одржува истата брзина и цена како 1.5 Flash, тој е подобар од 1.5 Flash во повеќето репери тестови.
- Контектен прозорец на милион нивоа: Исто така, поддржува 1M токени на моќ за обработка на контекст.
Според споредбата за евалуација на перформансите објавена од Google, Gemini 2.0 Pro Experimental верзијата постигна највисоки оценки во речиси сите репер тестови, изведувајќи одлично:

Особено добро се извршуваше во задачите за генерирање кодови (како LiveCodeBench v5) и сложените математички проблеми (како што се алгебра, геометрија и пресметка). Покрај тоа, имаше значително подобрување во тестот за разбирање сложени долги документи.
И цените
Google е исто така совесен производител во однос на економичноста на API.

Милиони токени на Gemini 2.0 Flash чинат помалку од еден долар... Поддржува повеќе режими, мрежни пребарувања и невиден контекстен прозорец.
Спротивно на тоа, Deepseek V3 моментално чини еден долар за милион токени, а заклучокот R1 чини четири долари.

PS: Но, сепак сакам да му се заблагодарам на DeepSeek за намалувањето на цената. Секој што може да ја намали цената е семејство.
Ова е навистина премногу евтино! Споредено со перформансите, мислам дека она што го занемариле Gemini е цената!
Изведба на случај
Бидејќи тврди дека е добар како Deepseek, дефинитивно мораме да видиме како всушност функционира во случаи и да видиме како различни корисници на интернет го тестирале
Финбол игра базирана на физика
Ајде прво да го погледнеме овој популарен случај, кој користи физички мотор за да симулира реални ефекти како што се судири, триење и гравитација.
Совет: Напишете програма за Python која прикажува топка која отскокнува во ротирачки шестоаголник. Топката треба да биде под влијание на гравитацијата и триењето и мора реално да отскокнува од ротирачките ѕидови
Вака функционираат Deepseek R1 и o3-min:

Верзијата генерирана од Gemini 2.0 Pro Experimental:

Останатите два модели не функционираат добро
Двојна тешкотија! Направете ја топката поделена на 100 топки!
Совет: Напишете скрипта за 100 скокачки светло жолти топки во сфера, внимавајќи правилно да се справите со откривањето судир. Направете ја сферата полека да се ротира. Погрижете се топчињата да останат во сферата. Имплементирајте во p5.js

Браво! Бавната ротација на сферата е многу мазна, а симулацијата на физичките закони е одлична. 100-те топки исто така постојано се судираат и „ја вршат својата работа“ ~
Напишете скрипта p5.js за да симулирате 25 честички кои отскокнуваат наоколу во вакуумски простор во цилиндричен контејнер. Користете различна боја за секоја топка и погрижете се тие да остават трага за да го покажат своето движење. Додадете бавна ротација на контејнерот за подобро да набљудувате што се случува на сцената. Погрижете се да создадете соодветни правила за откривање судир и физички правила за да се осигурате дека честичките остануваат во контејнерот. Додадете надворешен сферичен сад. Додајте бавен ефект на зумирање и одзумирање на целата сцена.

Прашање за тест со јагоди кое не може да се заобиколи
И умните (итри) корисници на интернет повторно го исфрлија класичниот тест со јагоди:
Колку р има во јагодата

И Gemini 2.0 Flash Thinking Experimental го доби вистинскиот одговор:

Шефот на Google, Џеф Дин, лично ги тестираше своите програмски вештини
Џеф Дин, главен научник во Google DeepMind и Google Research, исто така ги тестираше програмските вештини на бранот Gemini 2.0 Pro:

Тој го наложи моделот да ја заврши класичната игра Boggle, а кодот беше генериран првиот пат кога заврши со наоѓање на сите валидни зборови во „Плоштад на букви“ игра:

Покрај тоа, Џеф Дин рече дека кодот е завршен за само 18,9 секунди, што е многу брзо.

Извршниот директор на Google DeepMind е полн со доверба во ова големо ажурирање на моделот, велејќи дека ова издание ја поставува основата за Google да постигне идна идна работа со интелигентни агенти:

Извршниот директор на Google, Сундар Пичаи, претходно јасно стави до знаење дека 2025 година ќе биде критичен период за Google да го забрза развојот на полето на вештачката интелигенција. Се чувствува како по ова издание, рутата на Google е појасна!
Во споредба со маршрутите на другите гиганти, рутата со вештачка интелигенција на Google се фокусира повеќе на практичноста и директно обезбедува повеќе опции за верзија, исто како кутија со алатки за вештачка интелигенција, каде што можете да изберете и да изберете како што сакате, според вашите потреби, флексибилно и практично, и способни да ги задоволат сите видови потреби.