Didelės didelių dirbtinio intelekto modelių naudojimo išlaidos yra pagrindinė priežastis, kodėl daugelis AI programų dar neįdiegtos ir nereklamuojamos. Ekstremalaus našumo pasirinkimas reiškia didžiulius skaičiavimo energijos sąnaudas, o tai lemia dideles naudojimo išlaidas, kurių paprasti vartotojai negali priimti.
Konkurencija dėl didelių AI modelių yra tarsi karas be dūmų. Po to, kai DeepSeek išleido ir atidarė naujausią R1 didelį modelį, OpenAI taip pat išleido savo naujausią o3 modelį esant slėgiui. Didelis modelių žaidėjas „Google“ taip pat turėjo prisijungti prie aršios konkurencijos dėl pigių modelių.
Naujas „Google“ žingsnis: pristatyti nauji „Gemini“ serijos nariai
Ankstų vasario 6-osios rytą „Google“ pristatė naujų „Gemini“ modelio versijų seriją. Tarp jų – eksperimentinė versija Dvyniai 2.0 „Pro“ ir „Gemini 2.0 Flash – Lite“ peržiūros versija sulaukė didelio dėmesio, o naujausia „Gemini 2.0 Flash“ versija buvo oficialiai išleista.
Kaip naujas variantas, Google Gemini 2.0 „Flash – Lite“ labai patraukli kaina – tik 0,3 USD už milijoną žetonų, todėl iki šiol tai yra prieinamiausias „Google“ modelis.
Kita vertus, eksperimentinė „Gemini 2.0 Pro“ versija turi galingų vietinių daugiarūšių galimybių, kurios gali konvertuoti tekstą į garso ir vaizdo įrašus.
Eksperimentinė „Gemini 2.0 Flash Thinking“ versija yra nemokama, ji taip pat turi galimybę pasiekti, išgauti ir apibendrinti „YouTube“ vaizdo įrašų turinį.
Loganas Kilpatrickas, „Google AI Studio“ produktų vadovas, X platformoje paskelbė, kad šie modeliai yra „galingiausi modeliai Google istorijoje“ ir yra prieinami visiems kūrėjams.
Įspūdingi naujų Gemini modelių rezultatai ir rezultatai pirmaujančiųjų sąraše
„Chatbot Arena Large Model Leaderboard“ „Gemini 2.0 Flash Thinking Experimental Edition“ ir „Gemini 2.0 Pro Experimental Edition“ pasiekė puikių rezultatų. Palyginti su ankstesniais „Google“ dideliais modeliais, „Gemini 2.0“ padarė didelę pažangą ir nenuostabu, kad jie sėkmingai pasiekė pirmaujančiųjų sąrašo viršūnę, o bendras rezultatas pralenkė „ChatGPT-4o“ ir „DeepSeek-R1“. Tai didžiulis patobulinimas.
Šis rezultatas pagrįstas išsamiu didelių modelių galimybių įvertinimu įvairiose srityse, įskaitant matematiką, kodavimą ir daugiakalbį apdorojimą.
Kaina ir našumas: kiekvienas Gemini 2.0 variantas turi savų privalumų
Skirtingos Gemini 2.0 versijos turi savo ypatybes kainos ir našumo požiūriu. Buvo pasiektas našumo ir kainos balansas, suteikiantis vartotojams daugiau pasirinkimo galimybių. Įvairių Gemini 2.0 versijų API galima iškviesti per Google AI Studio ir Vertex AI. Kūrėjai ir vartotojai gali pasirinkti tinkamą versiją pagal savo poreikius.
Gemini 2.0 padarė didelę pažangą ir tobulėjo, palyginti su Gemini 1.5. Nors skirtingos Gemini 2.0 versijos turi skirtumų, jos visos buvo patobulintos. Tiksliau, turite nustatyti naudojamą scenarijų, tada galėsite geriau pasirinkti jums tinkantį Dvynių modelį.
Kalbant apie kainą, „Gemini 2.0 Flash“ ir „Gemini 2.0 Flash – Lite“ daugiausia dėmesio skiria lengvam diegimui. Jie palaiko iki 1 milijono žetonų kontekstinio lango ilgio, o kalbant apie kainodarą, skirtumas tarp ilgo ir trumpo teksto apdorojimo „Gemini 1.5 Flash“ buvo pašalintas, o kaina suvienodinta pagal vieneto žetonų kainą.
„Gemini 2.0 Flash“ kainuoja 0,4 USD už milijoną žetonų už teksto išvedimą, o tai yra pusė „Gemini 1.5 Flash“ kainos apdorojant ilgus tekstus.
Gemini 2.0 Flash – Lite yra dar geresnis sąnaudų optimizavimas didelio masto teksto išvesties scenarijuose, kai teksto išvesties kaina yra 0,3 USD už milijoną žetonų. Net „Google“ generalinis direktorius Sundaras Pichai jį gyrė kaip „veiksmingą ir galingą“.
Kalbant apie našumo gerinimą, „Gemini 2.0 Flash“ turi išsamesnes daugiarūšės sąveikos funkcijas nei „Lite“ versija. Numatyta, kad ji palaikys vaizdo išvestį, taip pat dviejų krypčių realaus laiko mažos delsos įvestį ir išvestį, pvz., tekstą, garsą ir vaizdo įrašą.
Eksperimentinė Gemini 2.0 Pro versija išsiskiria kodavimo našumu ir sudėtingais raginimais. Jo konteksto langas gali siekti iki 2 milijonų žetonų, o jo bendrieji gebėjimai padidėjo nuo 75.8% iki 79.1%, palyginti su ankstesne karta, o tai yra reikšmingas skirtumas tarp kodavimo ir samprotavimo galimybių naudojant Gemini 2.0 Flash ir Gemini 2.0 Flash – Lite.
Gemini programos komanda X platformoje teigė, kad Gemini Advanced vartotojai gali pasiekti eksperimentinę Gemini 2.0 Pro versiją per modelio išskleidžiamąjį meniu, o Gemini 2.0 Flash Thinking eksperimentinė versija yra nemokama Gemini programos naudotojams, o ši versija gali būti naudojama kartu su YouTube, Google paieška ir Google Maps.
Kova su konkurencija: „Google“ modelio ekonomiškumo konkursas
Tuo metu, kai modelių kūrimo išlaidos tapo karšta tema pramonėje, atvirojo kodo, pigaus ir didelio našumo DeepSeek – R1 pristatymas turėjo įtakos visai pramonei.
Per konferencinį pokalbį po „Google“ 2024 m. ketvirtojo ketvirčio finansinės ataskaitos paskelbimo Pichai, pripažindamas DeepSeek pasiekimus, taip pat pabrėžė, kad Gemini modelių serija pirmauja pagal kainos, našumo ir delsos pusiausvyrą ir kad jų bendras našumas yra geresnis nei DeepSeek V3 ir R1 modelių.
Žvelgiant iš Yang Likun ir jo komandos sukurto LiveBench didelio modelio našumo etaloninio testo reitingo, bendras Gemini 2.0 Flash reitingas yra aukštesnis nei DeepSeek V3 ir OpenAI o1 – mini, tačiau atsilieka nuo DeepSeek – R1 ir OpenAI o1. Tačiau „Google“ pristatyta „Gemini 2.0 Flash – Lite“ yra tarsi koziris. „Google“ tikisi padaryti naujausius didelius modelius įperkamus didesniam skaičiui žmonių, sumažinti vartotojų kaštus ir tikisi užimti vietą įmonių konkurencijoje dėl kainos ir našumo.
Po to, kai „Google“ išleido naujausia Gemini 2.0 versija, internautas pats pradėjo bandyti ir analizuoti Gemini 2.0 Flash ir kitus populiarius deepseek bei openai GPT-4o modelius. Jis nustatė, kad naujoji „Gemini 2.0 Flash“ versija lenkia kitus du modelius tiek našumu, tiek kaina. Tai taip pat suteikia mums žvilgsnį į „Google“ plėtrą ir raidą, ir tai yra gera pradžia.
Tiksliau, Gemini 2.0 Flash kainuoja 0,1 USD už milijoną žetonų už įvestį ir 0,4 USD už išvestį, kurie abu yra daug mažesni nei DeepSeek V3. Tai didžiulis tobulėjimas ir plėtra. Internautas taip pat atkreipė dėmesį į X platformą: „Oficiali Gemini 2.0 Flash versija kainuoja trečdalį GPT-4o-mini, o ji yra tris kartus greitesnė“.
Nauja tendencija didelėje modelių rinkoje: kainos ir kokybės santykis yra karalius
Šiandien didelis modelių laukas yra įtrauktas į naują kainų karą. Anksčiau didelės didelių modelių naudojimo išlaidos sukėlė tam tikrą pasipriešinimą jų naudojimui ir reklamai. Didelių modelių kainų karo, kurį sukėlė DeepSeek, įtaka užsienio didelių modelių rinkai vis dar stiprėja. Tuo pačiu metu atvirojo kodo parinktis taip pat leido daugiau vartotojų suprasti ir naudoti naujausius didelių modelių tyrimų rezultatus. Atvirojo kodo + žemos kainos strategija taip pat padarė spaudimą daugeliui Amerikos didelių modelių kompanijų.
„Google“ išleido „Gemini 2.0 Flash-Lite“, o „OpenAI“ padarė „ChatGPT“ paieškos funkciją laisvai prieinamą visiems vartotojams, kad vartotojai galėtų pasinaudoti paieškos funkcija įvairioms užduotims atlikti. „Meta“ vidinė komanda taip pat intensyvina didelių modelių kainų mažinimo strategijų tyrimus ir skatina tolesnį „Meta“ atvirojo kodo didelių modelių kūrimą.
Šioje itin konkurencingoje srityje jokia įmonė negali patogiai įsitaisyti pirmoje vietoje. Įmonės stengiasi pritraukti ir išlaikyti vartotojus gerindamos sąnaudų efektyvumą. Ši tendencija padės dideliems modeliams pereiti nuo grynos technologijos kūrimo prie platesnio pritaikymo, o būsima didelė modelių rinka toliau vystysis ir keisis konkurencija dėl ekonomiškumo.