A nagy mesterségesintelligencia-modellek használatának magas költségei a fő oka annak, hogy sok mesterségesintelligencia-alkalmazást még nem vezettek be és nem népszerűsítettek. Az extrém teljesítmény választása hatalmas számítási energiaköltséget jelent, ami olyan magas használati költségekhez vezet, amelyeket a hétköznapi felhasználók nem tudnak elfogadni.

A nagy mesterséges intelligencia modellekért folyó verseny olyan, mint egy háború füst nélkül. Miután az DeepSeek kiadta és megnyitotta a legújabb R1 nagy modellt, az OpenAI nyomás alatt kiadta saját legújabb o3 modelljét is. A nagy modelljátékosnak, a Google-nek is csatlakoznia kellett az alacsony költségű modellekért folyó kiélezett versenyhez.

A Google új lépése: bemutatták a Gemini sorozat új tagjait

Február 6-án kora reggel a Google piacra dobta a Gemini modell új verzióinak sorozatát. Közülük a kísérleti változata Gemini 2.0 A Pro és a Gemini 2.0 Flash – Lite előzetes verziója nagy figyelmet keltett, és hivatalosan is megjelent a Gemini 2.0 Flash legújabb verziója.

Új változatként Google Gemini 2.0 A Flash – Lite nagyon vonzó ára mindössze 0,3 USD millió tokenenként, így ez a Google eddigi legkedvezőbb árú modellje.

A Gemini 2.0 Pro kísérleti verziója viszont erőteljes natív multimodális képességekkel rendelkezik, amelyek képesek átváltani szöveget, hangot és videót.

A Gemini 2.0 Flash Thinking kísérleti verziója ingyenesen használható, és képes a YouTube-videók tartalmának elérésére, kibontására és összefoglalására is.

Logan Kilpatrick, a Google AI Studio termékeinek vezetője az X platformon bejelentette, hogy ezek a modellek „a Google történetének legerősebb modelljei”, és minden fejlesztő számára elérhetők.

Az új Gemini modellek lenyűgöző teljesítménye és eredményei a ranglistán

A Chatbot Arena Large Model Leaderboardjában a Gemini 2.0 Flash Thinking Experimental Edition és a Gemini 2.0 Pro Experimental Edition ért el kiemelkedő eredményeket. A Google korábbi nagymodelljeivel összehasonlítva a Gemini 2.0 nagyot fejlődött, és nem meglepő módon sikeresen feljutottak a ranglista élére, a ChatGPT-4o és az DeepSeek-R1 együttes pontszámával. Ez óriási előrelépés.

Ez az eredmény a nagy modellek képességeinek átfogó értékelésén alapul különböző területeken, beleértve a matematikát, a kódolást és a többnyelvű feldolgozást.

Ár és teljesítmény: a Gemini 2.0 minden változatának megvannak a maga előnyei

A Gemini 2.0 különböző verziói saját jellemzőkkel rendelkeznek az ár és a teljesítmény tekintetében. A teljesítmény és az ár egyensúlyát sikerült elérni, így a felhasználók több választási lehetőséget kínálnak. A Gemini 2.0 különböző verzióinak API-jai a Google AI Studión és a Vertex AI-n keresztül hívhatók meg. A fejlesztők és a felhasználók igényeiknek megfelelően választhatják ki a megfelelő verziót.

A Gemini 2.0 nagy előrehaladást és fejlődést ért el a Gemini 1.5-höz képest. Bár a Gemini 2.0 különböző verzióiban vannak eltérések, összességében mindegyiket továbbfejlesztették. Konkrétan meg kell határoznia a használt forgatókönyvet, majd jobban kiválaszthatja az Önnek megfelelő Gemini modellt.

Az ár tekintetében a Gemini 2.0 Flash és a Gemini 2.0 Flash – Lite a könnyű telepítésre összpontosít. Maximum 1 millió tokent támogatnak a kontextusablak hosszában, és az árképzést illetően a Gemini 1.5 Flash-ben megszűnt a különbség a hosszú és a rövid szövegfeldolgozás között, az árat pedig egységáron egységesítik.

A Gemini 2.0 Flash 0,4 USD-ba kerül millió tokenenként a szövegkiadásért, ami hosszú szövegek feldolgozása esetén fele a Gemini 1.5 Flash árának.

A Gemini 2.0 Flash – A Lite még jobb költségoptimalizálást biztosít nagyméretű szövegkiadási forgatókönyveknél, a szövegkimeneti ára 0,3 USD millió tokenenként. Még a Google vezérigazgatója, Sundar Pichai is „hatékonynak és erőteljesnek” méltatta.

A teljesítmény javítása szempontjából a Gemini 2.0 Flash átfogóbb multimodális interakciós funkciókkal rendelkezik, mint a Lite verzió. A tervek szerint támogatja a képkimenetet, valamint a kétirányú, valós idejű, alacsony késleltetésű be- és kimenetet, például szöveget, hangot és videót.

A Gemini 2.0 Pro kísérleti verziója a kódolási teljesítmény és az összetett promptok tekintetében jeleskedik. Kontextusablakja elérheti a 2 millió tokent, általános képessége pedig 75.8%-ről 79.1%-re nőtt az előző generációhoz képest, ami jelentős különbség a Gemini 2.0 Flash és a Gemini 2.0 Flash – Lite kódolási és érvelési képességében.

A Gemini alkalmazáscsapata az X platformon elmondta, hogy a Gemini Advanced felhasználók a modell legördülő menüjén keresztül érhetik el a Gemini 2.0 Pro kísérleti verzióját, a Gemini 2.0 Flash Thinking kísérleti verziója pedig ingyenes a Gemini alkalmazás felhasználóinak, és ez a verzió a YouTube-bal, a Google keresővel és a Google Térképpel együtt használható.

Elleni verseny: a Google modell-költséghatékonysági versenye

Abban az időben, amikor a modellfejlesztés költségei az iparágban felkapott téma lett, a nyílt forráskódú, alacsony költségű, nagy teljesítményű DeepSeek – R1 piacra dobása az egész iparágra hatással volt.

A Google 2024. negyedik negyedéves pénzügyi jelentésének közzététele utáni konferenciahívás során Pichai, miközben elismerte az DeepSeek eredményeit, azt is hangsúlyozta, hogy a Gemini modellsorozat vezető szerepet tölt be a költségek, a teljesítmény és a késleltetés közötti egyensúlyban, és általános teljesítményük jobb, mint az DeepSeek V3 és R1 modelljeié.

A Yang Likun és csapata által készített LiveBench nagymodell-teljesítmény-teszt rangsorolása szempontjából a Gemini 2.0 Flash összesített helyezése magasabb, mint az DeepSeek V3 és az OpenAI o1 – mini, de elmarad az DeepSeek – R1 és az OpenAI o1 mögött. A Gemini 2.0 Flash – Lite Google piacra dobása azonban olyan, mint egy ütőkártya. A Google azt reméli, hogy a legújabb nagy modelleket több ember számára megfizethetővé teheti, csökkenti a felhasználók használati költségeit, és reméli, hogy helyet foglal el a vállalatok közötti versenyben az ár/teljesítmény tekintetében.

Miután a Google kiadta a legújabb Gemini 2.0, egy netező önállóan elkezdte a Gemini 2.0 Flash és más népszerű deepseek és openai GPT-4o modellek elemzését. Megállapította, hogy a Gemini 2.0 Flash új verziója teljesítményben és költségben is felülmúlja a másik két modellt. Ezzel bepillantást nyerhetünk a Google fejlődésébe és fejlődésébe is, és ez egy jó kezdet.

Pontosabban, a Gemini 2.0 Flash ára 0,1 USD millió tokenenként a bemenetért és 0,4 USD a kimenetért, mindkettő jóval alacsonyabb, mint az DeepSeek V3. Ez óriási fejlődés és fejlődés. A netező az X platformon is rámutatott: "A Gemini 2.0 Flash hivatalos verziója a GPT-4o-mini egyharmadába kerül, miközben háromszor olyan gyors."

Új trend a nagy modellpiacon: az ár-érték arány a király

Ma új árháborúba keveredik a nagy modellek mezőnye. A múltban a nagy modellek használatának magas költsége némi ellenállást váltott ki használatukkal és promóciójukkal szemben. Az DeepSeek által kiváltott nagy modellek árháborúja a tengerentúli nagy modellek piacán továbbra is erjed. Ugyanakkor a nyílt forráskódú opció több felhasználó számára is lehetővé tette a legújabb nagymodellkutatási eredmények megértését és felhasználását. A nyílt forráskód + alacsony ár stratégia sok amerikai nagy modellcégre is nyomást gyakorolt.

A Google piacra dobta a Gemini 2.0 Flash-Lite-ot, az OpenAI pedig minden felhasználó számára ingyenesen elérhetővé tette a ChatGPT keresőfunkciót, így a felhasználók a kereső funkcióval változatosabb feladatokat végezhetnek. A Meta belső csapata a nagy modellek árcsökkentési stratégiáinak kutatását is fokozza, miközben támogatja a Meta nyílt forráskódú nagy modelljeinek továbbfejlesztését.

Ezen a rendkívül versenyképes területen egyetlen cég sem ülhet kényelmesen az első helyen. A vállalatok a költséghatékonyság javításával igyekeznek magukhoz vonzani és megtartani a felhasználókat. Ez a tendencia elősegíti, hogy a nagy modellek a puszta technológiai fejlesztésről a szélesebb körű alkalmazásra térjenek át, és a jövőbeni nagy modellpiac tovább fog fejlődni és megváltozni a költséghatékonyságért folyó versenyben.

Hasonló hozzászólások

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük