Google se laekostemodel, die Gemini 2.0-reeks, val aan: die stryd om kostedoeltreffendheid in groot modelle word verskerp

Die hoë koste verbonde aan die gebruik van groot KI-modelle is 'n groot rede waarom baie KI-toepassings nog nie geïmplementeer en bevorder is nie. Die keuse van uiterste werkverrigting beteken groot rekenaarkragkoste, wat lei tot hoë gebruikskoste wat gewone gebruikers nie kan aanvaar nie.

Die kompetisie vir groot KI-modelle is soos 'n oorlog sonder rook. Nadat DeepSeek die nuutste R1 groot model vrygestel en oopgemaak het, het OpenAI ook sy eie nuutste o3-model onder druk vrygestel. Groot modelspeler Google moes ook by die strawwe kompetisie vir laekostemodelle aansluit.

Inhoudsopgawe

Google se nuwe skuif: nuwe lede van die Gemini-reeks onthul

In die vroeë oggend van 6 Februarie het Google 'n reeks nuwe weergawes van die Gemini-model bekendgestel. Onder hulle, die eksperimentele weergawe van Tweeling 2.0 Pro en die voorskouweergawe van Gemini 2.0 Flash – Lite het baie aandag getrek, en die jongste weergawe van Gemini 2.0 Flash is amptelik vrygestel.

As 'n nuwe variant, Google Gemini 2.0 Flash – Lite het 'n baie aantreklike prys van slegs 0,3 USD per miljoen tokens, wat dit Google se mees bekostigbare model tot nog toe maak.

Die eksperimentele weergawe van Gemini 2.0 Pro, aan die ander kant, het kragtige inheemse multimodale vermoëns wat tussen teks en oudio en video kan omskakel.

Die eksperimentele weergawe van Gemini 2.0 Flash Thinking is gratis om te gebruik en het ook die vermoë om toegang tot die inhoud van YouTube-video's te verkry, te onttrek en op te som.

Logan Kilpatrick, hoof van Google AI Studio-produkte, het op die X-platform aangekondig dat hierdie modelle “die kragtigste modelle in Google se geskiedenis” is en vir alle ontwikkelaars beskikbaar is.

Die nuwe Gemini-modelle se indrukwekkende prestasie en resultate op die puntelys

In die Chatbot Arena Large Model Leaderboard het die Gemini 2.0 Flash Thinking Experimental Edition en Gemini 2.0 Pro Experimental Edition uitstekende resultate behaal. In vergelyking met vorige Google-grootmodelle het Gemini 2.0 groot vordering gemaak, en dit is nie verbasend dat hulle suksesvol die bopunt van die puntelys bereik het, met 'n gesamentlike telling wat ChatGPT-4o en DeepSeek-R1 oortref het. Dit is 'n groot verbetering.

Hierdie resultaat is gebaseer op 'n omvattende evaluering van die vermoëns van groot modelle op verskeie gebiede, insluitend wiskunde, kodering en veeltalige verwerking.

Prys en werkverrigting: elke variant van Gemini 2.0 het sy eie voordele

Die verskillende weergawes van Gemini 2.0 het hul eie kenmerke wat prys en werkverrigting betref. 'n Balans tussen prestasie en prys is bereik, wat gebruikers meer keuses gee. Die API's van die verskillende weergawes van Gemini 2.0 kan deur Google AI Studio en Vertex AI geroep word. Ontwikkelaars en gebruikers kan die toepaslike weergawe kies volgens hul behoeftes.

Gemini 2.0 het groot vordering en ontwikkeling gemaak in vergelyking met Gemini 1.5. Alhoewel die verskillende weergawes van Gemini 2.0 verskille het, is hulle almal oor die algemeen verbeter. Spesifiek, jy moet die scenario wat jy gebruik bepaal, en dan kan jy die Gemini-model beter kies wat jou pas.

Wat prys betref, fokus Gemini 2.0 Flash en Gemini 2.0 Flash – Lite op liggewig-ontplooiing. Hulle ondersteun tot 1 miljoen tokens in die lengte van die konteksvenster, en wat pryse betref, is die onderskeid tussen lang en kort teksverwerking in Gemini 1.5 Flash verwyder, en die prys is verenig teen 'n eenheidstekenprys.

Gemini 2.0 Flash kos 0.4 USD per miljoen tokens vir teksuitvoer, wat die helfte van die prys van Gemini 1.5 Flash is wanneer lang tekste verwerk word.

Gemini 2.0 Flash – Lite is selfs beter met kosteoptimalisering in grootskaalse teksuitvoer-scenario's, met 'n teksuitvoerprys van 0,3 USD per miljoen tokens. Selfs Google se uitvoerende hoof, Sundar Pichai, het dit geprys as “doeltreffend en kragtig”.

Wat prestasieverbetering betref, het Gemini 2.0 Flash meer omvattende multimodale interaksiefunksies as die Lite-weergawe. Dit is geskeduleer om beelduitvoer te ondersteun, sowel as tweerigting-intydse lae-latency-invoer en -uitvoer van modaliteite soos teks, oudio en video.

Die eksperimentele weergawe van Gemini 2.0 Pro blink uit in terme van enkoderingswerkverrigting en komplekse opdragte. Sy konteksvenster kan tot 2 miljoen tokens bereik, en sy algemene vermoë het toegeneem van 75.8% tot 79.1% in vergelyking met die vorige generasie, wat 'n beduidende verskil is in enkodering en redenasievermoë met Gemini 2.0 Flash en Gemini 2.0 Flash – Lite.

Die Gemini-toepassingspan het op die X-platform gesê dat Gemini Advanced-gebruikers toegang tot die Gemini 2.0 Pro-eksperimentele weergawe kan kry deur die model-aftrekkieslys, en die Gemini 2.0 Flash Thinking-eksperimentele weergawe is gratis vir Gemini-toepassingsgebruikers, en hierdie weergawe kan saam met YouTube, Google Search en Google Maps gebruik word.

Die stryd teen mededinging: Google-modelkostedoeltreffendheidskompetisie

In 'n tyd toe die koste van modelontwikkeling 'n warm onderwerp in die bedryf geword het, het die bekendstelling van die oopbron, laekoste, hoëprestasie DeepSeek – R1 'n impak op die hele bedryf gehad.

Tydens die konferensie-oproep na die vrystelling van Google se finansiële verslag vir die vierde kwartaal van 2024, het Pichai, terwyl hy erkenning gegee het aan die prestasies van DeepSeek, ook beklemtoon dat die Gemini-reeks modelle lei in die balans tussen koste, werkverrigting en vertraging, en dat hul algehele prestasie beter is as dié van DeepSeek se V3- en R1-modelle.

Uit die perspektief van die ranglys van die LiveBench-maatstaftoets vir groot model-prestasie wat deur Yang Likun en sy span gebou is, is die algehele ranglys van Gemini 2.0 Flash hoër as dié van DeepSeek V3 en OpenAI se o1 – mini, maar dit is agter DeepSeek – R1 en OpenAI se o1. Google se bekendstelling van Gemini 2.0 Flash – Lite is egter soos 'n troefkaart. Google hoop om die nuutste groot modelle vir meer mense bekostigbaar te maak, gebruikers se gebruikskoste te verminder en hoop om 'n plek in die kompetisie tussen maatskappye vir prys/prestasie in te neem.

Nadat Google die nuutste Gemini 2.0, het 'n netgebruiker begin om Gemini 2.0 Flash en ander gewilde deepseek- en openai GPT-4o-modelle op sy eie te probeer ontleed. Hy het gevind dat die nuwe weergawe van Gemini 2.0 Flash beter presteer as die ander twee modelle in terme van beide werkverrigting en koste. Dit gee ons ook 'n blik op Google se ontwikkeling en evolusie, en dit is 'n goeie begin.

Spesifiek, Gemini 2.0 Flash kos 0,1 USD per miljoen tokens vir insette en 0,4 USD vir uitset, wat albei baie laer is as DeepSeek V3. Dit is 'n groot verbetering en ontwikkeling. Die netizen het ook op die X-platform uitgewys: "Die amptelike weergawe van Gemini 2.0 Flash kos een derde van GPT-4o-mini, terwyl dit drie keer so vinnig is."

’n Nuwe neiging in die groot modelmark: waarde vir geld is koning

Vandag is die groot modelveld in 'n nuwe prysoorlog vasgevang. In die verlede het die hoë koste van die gebruik van groot modelle 'n mate van weerstand teen die gebruik en bevordering daarvan geskep. Die impak van die prysoorlog vir groot modelle wat deur DeepSeek op die oorsese grootmodelmark ontketen word, gaan steeds voort om te gis. Terselfdertyd het die oopbron-opsie ook meer gebruikers in staat gestel om die nuutste grootmodelnavorsingsresultate te verstaan en te gebruik. Die oopbron + lae prys-strategie het ook druk op baie Amerikaanse groot modelmaatskappye geplaas.

Google het Gemini 2.0 Flash-Lite bekendgestel, en OpenAI het die ChatGPT-soekfunksie vryelik aan alle gebruikers beskikbaar gestel, sodat gebruikers die soekfunksie kan gebruik om meer uiteenlopende take te voltooi. Die interne Meta-span versterk ook navorsing oor strategieë vir prysvermindering van groot modelle, terwyl hulle die verdere ontwikkeling van Meta se oopbron-groot modelle bevorder.

In hierdie hoogs mededingende veld kan geen maatskappy gemaklik op die nommer een plek sit nie. Maatskappye probeer gebruikers lok en behou deur kostedoeltreffendheid te verbeter. Hierdie neiging sal groot modelle help om van suiwer tegnologie-ontwikkeling na wyer toepassing te beweeg, en die toekomstige grootmodelmark sal voortgaan om te ontwikkel en te verander in die kompetisie vir kostedoeltreffendheid.

Google se laekostemodel, die Gemini 2.0-reeks, val aan: die stryd om kostedoeltreffendheid in groot modelle neem toe

Google se nuwe skuif: nuwe lede van die Gemini-reeks onthul

Die nuwe Gemini-modelle se indrukwekkende prestasie en resultate op die puntelys

Prys en werkverrigting: elke variant van Gemini 2.0 het sy eie voordele

Die stryd teen mededinging: Google-modelkostedoeltreffendheidskompetisie

’n Nuwe neiging in die groot modelmark: waarde vir geld is koning

Ali Qwen2.5-Max haal DeepSeek-V3 verby! Netizen: China se KI is vinnig besig om die gaping te sluit

Die geheim agter DeepSeek 1 | DeepSeekMath en GRPO besonderhede

Dit is naby DeepSeek-R1-32B en verpletter Fei-Fei Li se s1! UC Berkeley en ander oopbron nuwe SOTA-afleidingsmodelle

DeepSeek-R1-tegnologie onthul: kernbeginsels van die vraestel word afgebreek en die sleutel tot deurbraakmodelprestasie word onthul

Brekende nuus! OpenAI het vandag 2 nuwe afleidingsmodelle vrygestel: o3-mini en o3-mini-hoog.

Eerste bekendstelling! SiliconFlow X Huawei Cloud loods gesamentlik DeepSeek R1 en V3 afleidingsdienste gebaseer op die Ascend Cloud!

Maak 'n opvolg-bydrae Kanselleer die opvolg-bydrae

Google se nuwe skuif: nuwe lede van die Gemini-reeks onthul

Die nuwe Gemini-modelle se indrukwekkende prestasie en resultate op die puntelys

Prys en werkverrigting: elke variant van Gemini 2.0 het sy eie voordele

Die stryd teen mededinging: Google-modelkostedoeltreffendheidskompetisie

’n Nuwe neiging in die groot modelmark: waarde vir geld is koning

Soortgelyke plasings

Maak 'n opvolg-bydrae Kanselleer die opvolg-bydrae