
Hadithi ya Geminmimi 2.0 inaongeza kasi.
Toleo la Majaribio ya Flash Thinking mnamo Desemba lilileta wasanidi programu muundo wa kufanya kazi wenye utulivu wa chini na utendakazi wa juu.
Mapema mwaka huu, Jaribio la 2.0 Flash Thinking lilisasishwa katika Studio ya Google AI ili kuboresha zaidi utendakazi kwa kuchanganya kasi ya Flash na uwezo wa maongezi ulioimarishwa.
Wiki iliyopita, toleo lililosasishwa la 2.0 Flash lilizinduliwa kikamilifu kwenye kompyuta ya mezani ya Gemini na programu za simu.
Leo, wanachama watatu wapya wamezinduliwa kwa wakati mmoja: toleo la majaribio la Gemini 2.0 Pro, ambalo hadi sasa limefanya vyema katika usimbaji na vidokezo changamano, toleo la bei nafuu la 2.0 Flash-Lite na toleo lililoboreshwa la 2.0 Flash Thinking.
Gemini 2.0 Pro inachukua nafasi ya kwanza katika kategoria zote. Gemini-2.0-Flash safu katika tatu bora katika usimbaji, hisabati na mafumbo. Kiwango cha Flash-lite katika kumi bora katika kategoria zote.


Chati ya kulinganisha ya uwezo wa mifano mitatu:

Miundo yote inasaidia maandishi ya pembejeo na towe za moduli nyingi.
Uwezo zaidi wa modal uko njiani. Chati ya nguvu ya kielelezo katika uwanja wa usimbaji

Ramani ya kiwango cha joto cha kushinda

Google hushughulikia watumiaji bila malipo bora kuliko OpenAI inawashughulikia watumiaji wa Plus. Ufikiaji wa bure kwa Jaribio la Gemini 2.0 Pro katika Studio ya AI:

Huduma ya Deepseek daima huonyesha hitilafu ya kusubiri... Kumbuka kwamba modeli ya kwanza isiyo na makisio pia ilikuwa 2.0 Flash Thinking, ambayo ilitumika katika aistudio ya Google.

Kwa kuongeza, kuna toleo la wavuti la Gemini:
Pia kuna modeli iliyounganishwa ya uelekezaji (kwa nini itenganishe ...)

Google ilitoa toleo la majaribio la Gemini 2.0 Pro, na uboreshaji wa vipimo rasmi vya alama unavutia sana.

Ina uwezo mkubwa zaidi wa kusimba na uwezo wa kuchakata vidokezo changamano, na ina uwezo bora wa kuelewa na kusababu kuhusu maarifa ya ulimwengu kuliko muundo wowote uliotolewa na Google kufikia sasa.
Ina dirisha kubwa zaidi la muktadha (200k, na muktadha wangu mrefu ni faida kubwa ya mfano wa Gemini), ambayo huiwezesha kuchambua kwa kina na kuelewa idadi kubwa ya habari, na kupiga zana kama vile utaftaji wa Google na utekelezaji wa nambari.
Katika jaribio la MATH, ilipata 91.8%, ongezeko la takriban asilimia 5 juu ya toleo la 1.5. Uwezo wa kufikiri wa GPQA ulifikia 64.7%, na jaribio la maarifa ya ulimwengu la SimpleQA hata lilifikia 44.3%.
Kinachojulikana zaidi ni uwezo wa programu. Ilipata 36.0% katika jaribio la LiveCodeBench, na usahihi wa ubadilishaji wa Bird-SQL ulizidi 59.3%. Ikijumuishwa na dirisha kubwa la muktadha la tokeni milioni 2, inatosha kushughulikia kazi ngumu zaidi za uchanganuzi wa nambari.

Unaweza kuijaribu kwenye mshale.
Uwezo wa kuelewa lugha nyingi pia ni wa kuvutia, ukiwa na alama ya mtihani wa Global MMLU ya 86.5%. Uelewa wa picha MMMU ni 72.7%, na uwezo wa kuchanganua video ni 71.9%.
Gemini 2.0 Flash-Lite ni salio la kuvutia.
Inadumisha kasi na gharama ya Flash 1.5, lakini huleta utendakazi bora. Dirisha la muktadha na tokeni milioni 1 huiruhusu kuchakata maelezo zaidi.
Jambo linalofaa zaidi ni uwiano wa bei/utendaji: utengenezaji wa maelezo mafupi kwa picha 40,000 hugharimu chini ya $1. Hii inafanya AI kuwa chini zaidi.

Mwanablogu Shrivastava alitaja: Usimbaji wa Gemini 2.0 Pro ni wazimu!
Kidokezo: tumia Three.js kuunda uigaji wa mfumo wa jua. Ongeza kipimo cha muda, menyu kunjuzi ya kuzingatia, mizunguko ya onyesho na lebo za onyesho. Unda kila kitu katika faili moja ili niibandike kwenye kihariri cha mtandaoni na kutazama matokeo.

Kwa kuongezea, watumiaji wengine walisema kuwa Gemini 2.0 Flash ilitoa matokeo bora katika moja ya majaribio yake ya kitendawili:

Hatimaye, Google ilitaja kuwa usalama wa Gemini 2.0, sio tu kiraka, ni msingi wa kubuni tangu mwanzo.
Hebu mwanamitindo ajifunze kujikosoa. Tumia mafunzo ya kuimarisha ili kuruhusu Gemini kutathmini majibu yake na kutoa maoni sahihi zaidi. Hii huifanya kuwa imara zaidi unaposhughulika na mada nyeti.
Jaribio la timu nyekundu kiotomatiki linavutia. Imeundwa mahsusi ili kuzuia udungaji wa maneno ya papo hapo yasiyo ya moja kwa moja, ambayo ni kama kuandaa AI na mfumo wa kinga ili kuzuia mtu kuficha amri hasidi kwenye data.