Na stránkách Google Gemini 2.0 rodina je konečně kompletní! Vévodí žebříčkům hned po vydání.

Uprostřed pronásledování a blokád Deepseek, Qwen a o3, Google dnes brzy ráno vydal tři modely najednou: Gemini 2.0 Pro, Gemini 2.0 Flash a Gemini 2.0 Flash-Lite.

V žebříčku velkých modelů LMSYS vystřelil Gemini 2.0-Pro na vrchol a celá rodina Gemini-2.0 postoupila do top 10.

Nejprve se podívejme na výkon modelu

Na stránkách Modely Gemini 2.0 Všechny tentokrát vydané mají své vlastní přednosti z hlediska výkonu!

Gemini 2.0 Pro (experimentální)

Jako vlajkový model ze série Gemini, verze Pro představuje nejpokročilejší schopnosti AI společnosti Google a vyniká kódování a vyvozování zejména:

  • Extra velké kontextové okno: podporuje zpracování kontextu až 2M tokenů
  • Výkonná integrace nástrojů: hluboce integruje vyhledávání Google a spouštění kódu
  • Dostupnost: je již k dispozici jako experimentální verze na platformě Google AI Studio, Vertex AI a Gemini Advanced

Gemini 2.0 Flash

je umístěn jako a “vysoce výkonný pracant”. Je navržen se zaměřením na vyvážení rychlosti a výkonu a je určen k poskytování ideální podpory pro scénáře aplikací, které vyžadují odezvy s nízkou latencí:

  • Miliony kontextových oken: Podporuje kontext 1 milionu tokenů
  • Vynikající schopnosti multimodální inference: Dobrý ve zpracování multimodálních dat, v současné době podporuje multimodální vstup a single-modální textový vstup
  • Budoucí rozšíření funkcí: Brzy budou k dispozici funkce generování obrázků a převodu textu na řeč
  • Dostupnost: Oficiálně vydáno na platformách Vertex AI Studio a Google AI Studio a lze k němu přistupovat přes Gemini API.

Gemini 2.0 Flash-Lite (náhled)

Jako „nákladově nejefektivnější“ model nabízí Flash-Lite nejlepší rovnováhu mezi rychlostí, cenou a výkonem.

  • Nákladově efektivní výhody: Při zachování stejné rychlosti a nákladů jako 1,5 Flash překonává 1,5 Flash ve většině srovnávacích testů.
  • Kontextové okno na milionové úrovni: Podporuje také 1 milion tokenů výkonu zpracování kontextu.

Podle srovnání hodnocení výkonu vydaného společností Google dosáhla experimentální verze Gemini 2.0 Pro nejvyšší skóre téměř ve všech srovnávacích testech a vedla si výborně:

Obzvláště dobře fungoval v úlohách generování kódu (jako je LiveCodeBench v5) a složitých matematických problémech (jako je algebra, geometrie a počet). Kromě toho došlo k výraznému zlepšení v testu porozumění složitým dlouhým dokumentům.

A ceny

Google je také svědomitým výrobcem, pokud jde o nákladovou efektivitu API.

Milion tokenů Gemini 2.0 Flash stojí méně než jeden dolar… Podporuje více režimů, síťové vyhledávání a bezprecedentní kontextové okno.

Oproti tomu Deepseek V3 aktuálně stojí jeden dolar za milion tokenů a R1 inference stojí čtyři dolary.

PS: Ale i tak chci poděkovat DeepSeek za snížení ceny. Každý, kdo může snížit cenu, je rodina.

To je opravdu příliš levné! V porovnání s výkonem si myslím, že to, co bylo Gemini přehlíženo, je cena!

Výkon případu

Vzhledem k tomu, že tvrdí, že je stejně dobrý jako Deepseek, rozhodně musíme vidět, jak to skutečně funguje v případech, a podívat se, jak to testovali různí netizeni

Pinballová hra založená na fyzice

Pojďme se nejprve podívat na tento oblíbený případ, který využívá fyzikální engine k simulaci realistických efektů, jako jsou srážky, tření a gravitace.

Tip: Napište program Python, který zobrazí míč poskakující uvnitř rotujícího šestiúhelníku. Míč by měl být ovlivněn gravitací a třením a musí se realisticky odrážet od rotujících stěn

Deepseek R1 a o3-min fungují takto:

Verze generovaná Gemini 2.0 Pro Experimental:

Zbývající dva modely nefungují dobře

Dvojnásobná obtížnost! Rozdělte míč na 100 kuliček!

Tip: Napište skript pro 100 poskakujících jasně žlutých kuliček uvnitř koule a ujistěte se, že správně zvládáte detekci kolize. Nechte kouli pomalu otáčet. Ujistěte se, že kuličky zůstanou uvnitř koule. Implementujte v p5.js

Dobrá práce! Pomalé otáčení koule je velmi plynulé a simulace fyzikálních zákonů je vynikající. Těch 100 míčků se také neustále sráží a „dělají svou práci“ ~

Napište skript p5.js pro simulaci 25 částic poskakujících ve vakuovém prostoru uvnitř válcové nádoby. Pro každý míč použijte jinou barvu a ujistěte se, že zanechávají stopu, která ukazuje jejich pohyb. Přidejte pomalé otáčení kontejneru, abyste lépe sledovali, co se děje ve scéně. Ujistěte se, že jste vytvořili vhodná pravidla pro detekci kolizí a fyzikální pravidla, abyste zajistili, že částice zůstanou uvnitř nádoby. Přidejte externí kulovou nádobu. Přidejte efekt pomalého přibližování a oddalování celé scény.

Jahodová testovací otázka, kterou nelze obejít

A chytří (profláklí) netizeni zase vyhodili klasický jahodový test:

Kolik r je v jahodě

A Gemini 2.0 Flash Thinking Experimental má správnou odpověď:

Své programátorské dovednosti si osobně vyzkoušel šéf Googlu Jeff Dean

Jeff Dean, hlavní vědec Google DeepMind a Google Research, také testoval programátorské dovednosti vlny Gemini 2.0 Pro:

Nechal model dokončit klasickou hru Boggle a vygenerovaný kód poprvé dokončil nalezením všech platných slov v "písmenný čtverec" hra:

Navíc Jeff Dean řekl, že kód byl dokončen za pouhých 18,9 sekundy, což je velmi rychlé.

Generální ředitel společnosti Google DeepMind je plný důvěry v tuto významnou aktualizaci modelu a říká, že tato verze pokládá základ společnosti Google pro budoucí budoucí práci inteligentních agentů:

Generální ředitel společnosti Google Sundar Pichai již dříve jasně řekl, že rok 2025 bude pro Google kritickým obdobím pro urychlení vývoje v oblasti AI. Připadá mi to jako po tomto vydání je cesta Googlu jasnější!

Ve srovnání s trasami jiných gigantů, trasa AI Googlu se více zaměřuje na praktičnost a přímo poskytuje více možností verzí, stejně jako sada nástrojů AI, kde si můžete vybrat, jak chcete, podle svých potřeb, flexibilní a pohodlnýa je schopen uspokojit všechny druhy potřeb.

Podobné příspěvky

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *