Vysoké náklady na používání velkých modelů umělé inteligence jsou hlavním důvodem, proč mnoho aplikací umělé inteligence dosud nebylo implementováno a propagováno. Volba extrémního výkonu znamená obrovské náklady na výpočetní výkon, což vede k vysokým nákladům na používání, které běžní uživatelé nemohou akceptovat.
Konkurence pro velké modely AI je jako válka bez kouře. Poté, co DeepSeek uvolnil a otevřel zdroj nejnovějšího velkého modelu R1, OpenAI také pod tlakem vydal svůj vlastní nejnovější model o3. Do ostrého soupeření o levné modely se musel zapojit i přehrávač velkých modelů Google.
Nový krok společnosti Google: odhalení nových členů série Gemini
V časných ranních hodinách 6. února spustil Google sérii nových verzí modelu Gemini. Mezi nimi i experimentální verze Blíženci 2.0 Pro a preview verze Gemini 2.0 Flash – Lite vzbudily velkou pozornost a byla oficiálně vydána nejnovější verze Gemini 2.0 Flash.
Jako nová varianta, Google Gemini 2.0 Flash – Lite má velmi atraktivní cenu pouhých 0,3 USD za milion tokenů, což z něj dělá doposud nejdostupnější model od Googlu.
Experimentální verze Gemini 2.0 Pro má na druhou stranu výkonné nativní multimodální schopnosti, které umí převádět mezi textem a zvukem a videem.
Experimentální verze Gemini 2.0 Flash Thinking je zdarma k použití a má také možnost přístupu, extrahování a shrnutí obsahu videí YouTube.
Logan Kilpatrick, vedoucí produktů Google AI Studio, oznámil na platformě X, že tyto modely jsou „nejvýkonnějšími modely v historii Google“ a jsou dostupné všem vývojářům.
Působivý výkon a výsledky nových modelů Gemini v žebříčku
V žebříčku velkých modelů Chatbot Arena dosáhly Gemini 2.0 Flash Thinking Experimental Edition a Gemini 2.0 Pro Experimental Edition vynikajících výsledků. Ve srovnání s předchozími velkými modely Google udělala Gemini 2.0 velký pokrok a není překvapením, že se úspěšně dostala na vrchol žebříčku, s kombinovaným skóre překonalo ChatGPT-4o a DeepSeek-R1. To je obrovské zlepšení.
Tento výsledek je založen na komplexním vyhodnocení schopností velkých modelů v různých oblastech, včetně matematiky, kódování a vícejazyčného zpracování.
Cena a výkon: každá varianta Gemini 2.0 má své výhody
Různé verze Gemini 2.0 mají své vlastní charakteristiky z hlediska ceny a výkonu. Bylo dosaženo rovnováhy mezi výkonem a cenou, což uživatelům dává více možností. Rozhraní API různých verzí Gemini 2.0 lze volat prostřednictvím Google AI Studio a Vertex AI. Vývojáři a uživatelé si mohou vybrat vhodnou verzi podle svých potřeb.
Gemini 2.0 udělalo oproti Gemini 1.5 velký pokrok a vývoj. Přestože se různé verze Gemini 2.0 liší, všechny byly celkově vylepšeny. Konkrétně si musíte určit scénář, který používáte, a pak si můžete lépe vybrat model Gemini, který vám vyhovuje.
Cenově se Gemini 2.0 Flash a Gemini 2.0 Flash – Lite zaměřují na odlehčené nasazení. Podporují až 1 milion tokenů v délce kontextového okna a z hlediska cenového bylo odstraněno rozlišení mezi zpracováním dlouhého a krátkého textu v Gemini 1.5 Flash a cena je sjednocena na jednotkovou cenu tokenu.
Gemini 2.0 Flash stojí 0,4 USD za milion tokenů za textový výstup, což je polovina ceny Gemini 1.5 Flash při zpracování dlouhých textů.
Gemini 2.0 Flash – Lite je ještě lepší z hlediska optimalizace nákladů ve scénářích rozsáhlého textového výstupu s cenou textového výstupu 0,3 USD za milion tokenů. Dokonce i generální ředitel společnosti Google Sundar Pichai jej chválil jako „účinný a výkonný“.
Pokud jde o zlepšení výkonu, Gemini 2.0 Flash má komplexnější funkce multimodální interakce než verze Lite. Je naplánováno, že bude podporovat obrazový výstup, stejně jako obousměrný vstup v reálném čase s nízkou latencí a výstup modalit, jako je text, zvuk a video.
Experimentální verze Gemini 2.0 Pro vyniká výkonem kódování a komplexními výzvami. Jeho kontextové okno může dosáhnout až 2 milionů tokenů a jeho obecná schopnost se ve srovnání s předchozí generací zvýšila z 75.8% na 79.1%, což je významný rozdíl ve schopnosti kódování a uvažování u Gemini 2.0 Flash a Gemini 2.0 Flash – Lite.
Aplikační tým Gemini na platformě X uvedl, že uživatelé Gemini Advanced mají přístup k experimentální verzi Gemini 2.0 Pro prostřednictvím rozbalovací nabídky modelu a experimentální verze Gemini 2.0 Flash Thinking je pro uživatele aplikace Gemini zdarma a tuto verzi lze používat ve spojení s YouTube, vyhledáváním Google a Google Maps.
Boj proti konkurenci: soutěž o nákladovou efektivitu modelu Google
V době, kdy se náklady na vývoj modelu staly žhavým tématem v oboru, mělo uvedení open source, nízkonákladového a vysoce výkonného DeepSeek – R1 dopad na celé odvětví.
Během konferenčního hovoru po zveřejnění finanční zprávy společnosti Google za čtvrté čtvrtletí 2024 Pichai při uznání úspěchů DeepSeek také zdůraznil, že řada modelů Gemini vede v rovnováze mezi cenou, výkonem a latencí a že jejich celkový výkon je lepší než u modelů V3 a R1 DeepSeek.
Z pohledu hodnocení benchmarkového testu velkého modelu LiveBench, který vytvořil Yang Likun a jeho tým, je celkové hodnocení Gemini 2.0 Flash vyšší než u DeepSeek V3 a OpenAI o1 – mini, ale zaostává za DeepSeek – R1 a OpenAI o1. Nicméně uvedení Gemini 2.0 Flash – Lite od Googlu je jako trumf. Google doufá, že zpřístupní nejnovější velké modely více lidem, sníží uživatelům náklady na používání a doufá, že obsadí místo v soutěži mezi společnostmi v poměru cena/výkon.
Poté, co Google vydal nejnovější Gemini 2.0, Netizen začal sám zkoušet a analyzovat Gemini 2.0 Flash a další populární modely deepseek a openai GPT-4o. Zjistil, že nová verze Gemini 2.0 Flash překonává ostatní dva modely jak z hlediska výkonu, tak nákladů. To nám také umožňuje nahlédnout do vývoje a vývoje Google a je to dobrý začátek.
Konkrétně Gemini 2.0 Flash stojí 0,1 USD za milion tokenů za vstup a 0,4 USD za výstup, obojí je mnohem nižší než DeepSeek V3. To je obrovské zlepšení a vývoj. Netizen také poukázal na platformu X: "Oficiální verze Gemini 2.0 Flash stojí jednu třetinu GPT-4o-mini, zatímco je třikrát rychlejší."
Nový trend na trhu velkých modelů: hodnota za peníze je král
Dnes je velké modelářské pole chyceno v nové cenové válce. V minulosti vysoké náklady na používání velkých modelů vytvářely určitý odpor k jejich používání a propagaci. Dopad cenové války u velkých modelů vyvolané DeepSeek na zámořský trh velkých modelů stále kvasí. Možnost s otevřeným zdrojovým kódem zároveň umožnila více uživatelům porozumět a používat nejnovější výsledky výzkumu velkých modelů. Strategie open source + nízké ceny také vyvinula tlak na mnoho amerických velkých modelových společností.
Google spustil Gemini 2.0 Flash-Lite a OpenAI zpřístupnilo vyhledávací funkci ChatGPT volně všem uživatelům, takže uživatelé mohou používat vyhledávací funkci k plnění rozmanitějších úkolů. Interní tým Meta také zintenzivňuje výzkum strategií snižování cen velkých modelů a zároveň podporuje další vývoj velkých modelů Meta s otevřeným zdrojovým kódem.
V tomto vysoce konkurenčním oboru se žádná společnost nemůže pohodlně usadit na pozici číslo jedna. Společnosti se snaží přilákat a udržet uživatele zlepšením nákladové efektivity. Tento trend pomůže velkým modelům přejít od čistě technologického vývoje k širšímu uplatnění a budoucí trh velkých modelů se bude nadále vyvíjet a měnit v soutěži o nákladovou efektivitu.