Visoki stroški uporabe velikih modelov umetne inteligence so glavni razlog, zakaj številne aplikacije umetne inteligence še niso bile implementirane in promovirane. Izbira ekstremne zmogljivosti pomeni velike stroške računalniške moči, kar vodi do visokih stroškov uporabe, ki jih običajni uporabniki ne morejo sprejeti.
Tekmovanje za velike modele AI je kot vojna brez dima. Potem ko je DeepSeek izdal in odprl kodo najnovejši veliki model R1, je OpenAI pod pritiskom izdal tudi svoj najnovejši model o3. V ostro konkurenco za nizkocenovne modele se je moral vključiti tudi velik modelarski igralec Google.
Googlova nova poteza: predstavljeni novi člani serije Gemini
Zgodaj zjutraj 6. februarja je Google predstavil serijo novih različic modela Gemini. Med njimi je eksperimentalna različica Gemini 2.0 Pro in predogledna različica Gemini 2.0 Flash – Lite sta pritegnili veliko pozornosti in zadnja različica Gemini 2.0 Flash je bila uradno izdana.
Kot nova varianta, Google Gemini 2.0 Flash – Lite ima zelo privlačno ceno le 0,3 USD na milijon žetonov, zaradi česar je Googlov najbolj dostopen model do zdaj.
Eksperimentalna različica Gemini 2.0 Pro pa ima zmogljive domače multimodalne zmogljivosti, ki lahko pretvarjajo med besedilom ter zvokom in videom.
Eksperimentalna različica Gemini 2.0 Flash Thinking je brezplačna za uporabo in ima tudi možnost dostopa, ekstrahiranja in povzemanja vsebine YouTube videoposnetkov.
Logan Kilpatrick, vodja izdelkov Google AI Studio, je na platformi X objavil, da so ti modeli "najmočnejši modeli v zgodovini Googla" in so na voljo vsem razvijalcem.
Impresivna zmogljivost in rezultati novih modelov Gemini na lestvici najboljših
Na lestvici Chatbot Arena Large Model Leaderboard sta različici Gemini 2.0 Flash Thinking Experimental Edition in Gemini 2.0 Pro Experimental Edition dosegli izjemne rezultate. V primerjavi s prejšnjimi velikimi Googlovimi modeli je Gemini 2.0 dosegel velik napredek in ni presenetljivo, da so uspešno dosegli vrh lestvice najboljših, s skupnim rezultatom, ki je presegel ChatGPT-4o in DeepSeek-R1. To je velik napredek.
Ta rezultat temelji na celoviti oceni zmogljivosti velikih modelov na različnih področjih, vključno z matematiko, kodiranjem in večjezično obdelavo.
Cena in zmogljivost: vsaka različica Gemini 2.0 ima svoje prednosti
Različne različice Gemini 2.0 imajo svoje značilnosti glede cene in zmogljivosti. Doseženo je bilo ravnovesje med zmogljivostjo in ceno, kar uporabnikom omogoča večjo izbiro. API-je različnih različic Gemini 2.0 je mogoče priklicati prek Google AI Studio in Vertex AI. Razvijalci in uporabniki lahko izberejo ustrezno različico glede na svoje potrebe.
Gemini 2.0 je dosegel velik napredek in razvoj v primerjavi z Gemini 1.5. Čeprav imajo različne različice Gemini 2.0 razlike, so bile vse na splošno izboljšane. Natančneje, določiti morate scenarij, ki ga uporabljate, nato pa lahko bolje izberete model Gemini, ki vam ustreza.
Kar zadeva ceno, se Gemini 2.0 Flash in Gemini 2.0 Flash – Lite osredotočata na lahko namestitev. Podpirajo do 1 milijon žetonov v dolžini kontekstnega okna, kar zadeva cene, je bila odstranjena razlika med obdelavo dolgega in kratkega besedila v Gemini 1.5 Flash, cena pa je poenotena na ceno žetona na enoto.
Gemini 2.0 Flash stane 0,4 USD na milijon žetonov za izpis besedila, kar je polovica cene Gemini 1.5 Flash pri obdelavi dolgih besedil.
Gemini 2.0 Flash – Lite je še boljši pri optimizaciji stroškov v scenarijih izpisa besedila v velikem obsegu, s ceno izpisa besedila 0,3 USD na milijon žetonov. Celo izvršni direktor Googla Sundar Pichai ga je pohvalil kot "učinkovitega in močnega".
Kar zadeva izboljšanje zmogljivosti, ima Gemini 2.0 Flash obsežnejše multimodalne interakcijske funkcije kot različica Lite. Načrtovano je, da podpira slikovni izhod ter dvosmerni vnos in izhod v realnem času z nizko zakasnitvijo modalitet, kot so besedilo, zvok in video.
Eksperimentalna različica Gemini 2.0 Pro se odlikuje po zmogljivosti kodiranja in kompleksnih pozivih. Njegovo kontekstno okno lahko doseže do 2 milijona žetonov, njegova splošna zmogljivost pa se je povečala s 75.8% na 79.1% v primerjavi s prejšnjo generacijo, kar je pomembna razlika v zmožnosti kodiranja in sklepanja z Gemini 2.0 Flash in Gemini 2.0 Flash – Lite.
Ekipa aplikacije Gemini je na platformi X povedala, da lahko uporabniki Gemini Advanced do eksperimentalne različice Gemini 2.0 Pro dostopajo prek spustnega menija modela, eksperimentalna različica Gemini 2.0 Flash Thinking pa je brezplačna za uporabnike aplikacije Gemini in to različico je mogoče uporabljati v povezavi z YouTubom, iskanjem Google in Google Zemljevidi.
Boj proti konkurenci: tekmovanje v stroškovni učinkovitosti modela Google
V času, ko so stroški razvoja modela postali vroča tema v industriji, je lansiranje odprtokodnega, poceni in visoko zmogljivega DeepSeek – R1 vplivalo na celotno industrijo.
Med konferenčnim klicem po objavi Googlovega finančnega poročila za četrto četrtletje 2024 je Pichai ob priznavanju dosežkov DeepSeek poudaril tudi, da je serija modelov Gemini vodilna v ravnotežju med stroški, zmogljivostjo in zakasnitvijo ter da je njihova splošna zmogljivost boljša kot pri modelih V3 in R1 DeepSeek.
Z vidika razvrstitve primerjalnega preizkusa zmogljivosti velikih modelov LiveBench, ki so ga izdelali Yang Likun in njegova ekipa, je skupna uvrstitev Gemini 2.0 Flash višja od uvrstitve DeepSeek V3 in o1 – mini OpenAI, vendar zaostaja za DeepSeek – R1 in o1 OpenAI. Vendar je Googlova predstavitev Gemini 2.0 Flash – Lite kot adut. Google upa, da bo najnovejše velike modele naredil dostopne več ljudem, zmanjšal stroške uporabe uporabnikov in upa, da bo zasedel mesto v konkurenci med podjetji glede cene in zmogljivosti.
Potem ko je Google izdal najnovejši Gemini 2.0, je netizen začel sam poskušati analizirati Gemini 2.0 Flash in druge priljubljene modele deepseek in openai GPT-4o. Ugotovil je, da nova različica Gemini 2.0 Flash prekaša druga dva modela tako glede zmogljivosti kot stroškov. To nam daje tudi vpogled v razvoj in razvoj Googla, kar je dober začetek.
Natančneje, Gemini 2.0 Flash stane 0,1 USD na milijon žetonov za vnos in 0,4 USD za izhod, kar je veliko nižje od DeepSeek V3. To je velik napredek in razvoj. Netizen je na platformi X poudaril tudi: "Uradna različica Gemini 2.0 Flash stane eno tretjino GPT-4o-mini, medtem ko je trikrat hitrejša."
Nov trend na velikem trgu modelov: vrednost za denar je glavna
Danes je veliko modelsko področje ujeto v novo cenovno vojno. V preteklosti so visoki stroški uporabe velikih modelov ustvarili določen odpor do njihove uporabe in promocije. Vpliv cenovne vojne za velike modele, ki jo je sprožil DeepSeek na čezmorskem trgu velikih modelov, še vedno vre. Hkrati je odprtokodna možnost več uporabnikom omogočila razumevanje in uporabo najnovejših rezultatov raziskav velikih modelov. Strategija odprte kode + nizke cene je prav tako pritiskala na mnoga ameriška velika modelska podjetja.
Google je lansiral Gemini 2.0 Flash-Lite, OpenAI pa je iskalno funkcijo ChatGPT omogočil brezplačno dostopnost vsem uporabnikom, tako da lahko uporabniki uporabljajo iskalno funkcijo za dokončanje več raznolikih nalog. Notranja ekipa Mete prav tako pospešuje raziskave strategij zniževanja cen velikih modelov, hkrati pa spodbuja nadaljnji razvoj odprtokodnih velikih modelov Mete.
Na tem zelo konkurenčnem področju nobeno podjetje ne more udobno sedeti na prvem mestu. Podjetja poskušajo pritegniti in obdržati uporabnike z izboljšanjem stroškovne učinkovitosti. Ta trend bo velikim modelom pomagal preiti iz čistega tehnološkega razvoja v širšo uporabo, prihodnji trg velikih modelov pa se bo še naprej razvijal in spreminjal v konkurenci za stroškovno učinkovitost.