Visoki troškovi korištenja velikih AI modela glavni su razlog zašto mnoge AI aplikacije još nisu implementirane i promovirane. Odabir ekstremnih performansi znači velike troškove računalne snage, što dovodi do visokih troškova korištenja koje obični korisnici ne mogu prihvatiti.
Natjecanje za velike AI modele je poput rata bez dima. Nakon što je DeepSeek objavio i otvorio izvorni kod najnovijeg velikog modela R1, OpenAI je također pod pritiskom objavio svoj najnoviji model o3. Veliki igrač modela Google se također morao uključiti u oštru konkurenciju za jeftine modele.
Googleov novi potez: predstavljeni novi članovi serije Gemini
U rano jutro 6. veljače Google je lansirao niz novih verzija modela Gemini. Među njima, eksperimentalna verzija Gemini 2.0 Pro i preview verzija Gemini 2.0 Flash – Lite privukle su veliku pozornost, a najnovija verzija Gemini 2.0 Flasha službeno je objavljena.
Kao nova varijanta, Google Gemini 2.0 Flash – Lite ima vrlo atraktivnu cijenu od samo 0,3 USD za milijun tokena, što ga čini Googleovim najpristupačnijim modelom do sada.
Eksperimentalna verzija Gemini 2.0 Pro, s druge strane, ima snažne izvorne multimodalne mogućnosti koje mogu pretvarati tekst, audio i video obrnuto.
Eksperimentalna verzija Gemini 2.0 Flash Thinking besplatna je za korištenje i također ima mogućnost pristupa, izdvajanja i sažimanja sadržaja YouTube videa.
Logan Kilpatrick, voditelj Google AI Studio proizvoda, objavio je na X platformi da su ovi modeli “najmoćniji modeli u Googleovoj povijesti” i da su dostupni svim programerima.
Impresivne performanse i rezultati na ljestvici novih modela Gemini
Na Chatbot Areni Large Model Leaderboard, Gemini 2.0 Flash Thinking Experimental Edition i Gemini 2.0 Pro Experimental Edition postigli su izvanredne rezultate. U usporedbi s prethodnim velikim Googleovim modelima, Gemini 2.0 je napravio veliki napredak, i nimalo iznenađujuće, uspješno su dosegli vrh ljestvice, s kombiniranim rezultatom koji je nadmašio ChatGPT-4o i DeepSeek-R1. Ovo je veliki napredak.
Ovaj se rezultat temelji na opsežnoj procjeni mogućnosti velikih modela u raznim područjima, uključujući matematiku, kodiranje i višejezičnu obradu.
Cijena i performanse: svaka varijanta Gemini 2.0 ima svoje prednosti
Različite verzije Geminija 2.0 imaju svoje karakteristike u pogledu cijene i izvedbe. Postignuta je ravnoteža između performansi i cijene, što korisnicima daje više izbora. API-ji različitih verzija Gemini 2.0 mogu se pozvati putem Google AI Studio i Vertex AI. Programeri i korisnici mogu odabrati odgovarajuću verziju prema svojim potrebama.
Gemini 2.0 je napravio veliki napredak i razvoj u odnosu na Gemini 1.5. Iako različite verzije Geminija 2.0 imaju razlike, sve su općenito poboljšane. Točnije, morate odrediti scenarij koji koristite, a zatim možete bolje odabrati model Gemini koji vam odgovara.
Što se tiče cijene, Gemini 2.0 Flash i Gemini 2.0 Flash – Lite usmjereni su na laganu implementaciju. Podržavaju do 1 milijun tokena u duljini kontekstnog prozora, a što se tiče cijena, razlika između obrade dugog i kratkog teksta u Gemini 1.5 Flash je uklonjena, a cijena je objedinjena na jediničnu cijenu tokena.
Gemini 2.0 Flash košta 0,4 USD po milijunu tokena za ispis teksta, što je upola manje od Gemini 1.5 Flash pri obradi dugih tekstova.
Gemini 2.0 Flash – Lite još je bolji u optimizaciji troškova u scenarijima izlaza teksta velikih razmjera, s cijenom izlaza teksta od 0,3 USD za milijun tokena. Čak ga je i izvršni direktor Googlea Sundar Pichai pohvalio kao "učinkovit i snažan".
Što se tiče poboljšanja performansi, Gemini 2.0 Flash ima sveobuhvatnije funkcije multimodalne interakcije od verzije Lite. Predviđeno je da podržava izlaz slike, kao i dvosmjerni unos i izlaz modaliteta kao što su tekst, audio i video u stvarnom vremenu niske latencije.
Eksperimentalna verzija Gemini 2.0 Pro ističe se u smislu performansi kodiranja i složenih upita. Njegov kontekstni prozor može dosegnuti do 2 milijuna tokena, a njegova opća sposobnost porasla je sa 75.8% na 79.1% u usporedbi s prethodnom generacijom, što je značajna razlika u sposobnosti kodiranja i zaključivanja s Gemini 2.0 Flash i Gemini 2.0 Flash – Lite.
Tim aplikacije Gemini rekao je na platformi X da korisnici Gemini Advanced mogu pristupiti eksperimentalnoj verziji Gemini 2.0 Pro putem padajućeg izbornika modela, a eksperimentalna verzija Gemini 2.0 Flash Thinking je besplatna za korisnike aplikacije Gemini, a ova se verzija može koristiti zajedno s YouTubeom, Google pretraživanjem i Google kartama.
Suprotstavljanje konkurenciji: natjecanje Google modela isplativosti
U vrijeme kada je cijena razvoja modela postala vruća tema u industriji, lansiranje otvorenog izvornog koda, jeftinog DeepSeek – R1 visokih performansi imalo je utjecaj na cijelu industriju.
Tijekom konferencijskog poziva nakon objave financijskog izvješća Googlea za četvrto tromjesečje 2024., Pichai je, priznajući postignuća DeepSeek, također naglasio da je Gemini serija modela vodeća u ravnoteži između cijene, performansi i latencije, te da je njihova ukupna izvedba bolja od one kod DeepSeek V3 i R1 modela.
Iz perspektive poretka LiveBench testa mjerila performansi velikog modela koji su izradili Yang Likun i njegov tim, ukupni poredak Gemini 2.0 Flasha viši je od onog DeepSeek V3 i OpenAI-jevog o1 – mini, ali je iza DeepSeek – R1 i OpenAI-jevog o1. Međutim, Googleovo lansiranje Gemini 2.0 Flash – Lite je kao adut. Google se nada da će najnovije velike modele učiniti dostupnima većem broju ljudi, smanjiti korisničke troškove i nada se da će zauzeti mjesto u konkurenciji između kompanija za cijenu/performanse.
Nakon što je Google objavio najnoviji Gemini 2.0, netizen je počeo sam pokušavati analizirati Gemini 2.0 Flash i druge popularne modele deepseek i openai GPT-4o. Otkrio je da nova verzija Gemini 2.0 Flash nadmašuje druga dva modela u pogledu izvedbe i cijene. Ovo nam također daje uvid u Googleov razvoj i evoluciju, i to je dobar početak.
Konkretno, Gemini 2.0 Flash košta 0,1 USD za milijun tokena za ulaz i 0,4 USD za izlaz, a oba su daleko niža od DeepSeek V3. Ovo je veliki napredak i razvoj. Netizen je također istaknuo na X platformi: "Službena verzija Gemini 2.0 Flash košta jednu trećinu GPT-4o-mini, dok je tri puta brža."
Novi trend na velikom tržištu modela: vrijednost za novac je ključna
Danas je veliko polje modela uhvaćeno u novi rat cijenama. U prošlosti su visoki troškovi korištenja velikih modela stvorili određeni otpor prema njihovoj uporabi i promociji. Utjecaj cjenovnog rata za velike modele koji je pokrenuo DeepSeek na inozemno tržište velikih modela još uvijek fermentira. U isto vrijeme, opcija otvorenog koda također je omogućila većem broju korisnika da razumiju i koriste najnovije rezultate istraživanja velikih modela. Strategija otvorenog koda + niske cijene također je izvršila pritisak na mnoge američke velike modelske tvrtke.
Google je pokrenuo Gemini 2.0 Flash-Lite, a OpenAI je ChatGPT funkciju pretraživanja učinio besplatno dostupnom svim korisnicima, tako da korisnici mogu koristiti funkciju pretraživanja za obavljanje raznovrsnijih zadataka. Metin interni tim također pojačava istraživanje o strategijama smanjenja cijene velikih modela dok promiče daljnji razvoj Metinih velikih modela otvorenog koda.
U ovom visoko konkurentnom području nijedna tvrtka ne može udobno sjediti na prvom mjestu. Tvrtke pokušavaju privući i zadržati korisnike povećanjem isplativosti. Ovaj trend pomoći će velikim modelima prijeći s čistog tehnološkog razvoja na širu primjenu, a buduće tržište velikih modela nastavit će se razvijati i mijenjati u natjecanju za isplativost.