The Google Gemini 2.0 familia hatimaye imekamilika! Inatawala chati mara tu inapotolewa.

Katikati ya harakati na vizuizi vya Deepseek, Qwen na o3, Google ilitoa miundo mitatu kwa muda mfupi mapema leo asubuhi: Gemini 2.0 Pro, Gemini 2.0 Flash na Gemini 2.0 Flash-Lite.

Kwenye safu kubwa za modeli za LMSYS, Gemini 2.0-Pro imepanda kileleni, na familia ya Gemini-2.0 imeingia kwenye 10 bora.

Hebu tuangalie kwanza utendaji wa mfano

The Mifano ya Gemini 2.0 iliyotolewa wakati huu zote zina mambo muhimu yao kuhusu utendakazi!

Gemini 2.0 Pro (Majaribio)

Kama mfano wa bendera ya mfululizo wa Gemini, toleo la Pro linawakilisha uwezo wa juu zaidi wa AI wa Google, na hufaulu zaidi coding na inference hasa:

  • Dirisha kubwa zaidi la muktadha: inasaidia uchakataji wa muktadha hadi 2M ishara
  • Ujumuishaji wa zana yenye nguvu: inaunganisha kwa undani utaftaji wa Google na utekelezaji wa nambari
  • Upatikanaji: tayari inapatikana kama toleo la majaribio kwenye Google AI Studio, Vertex AI na jukwaa la Gemini Advanced

Gemini 2.0 Flash

imewekwa kama a "farasi wa kazi wenye ufanisi sana". Imeundwa kwa kuangazia kusawazisha kasi na utendakazi, na inakusudiwa kutoa usaidizi bora kwa matukio ya programu ambayo yanahitaji majibu ya muda wa chini wa kusubiri:

  • Mamilioni ya madirisha ya muktadha: Inaauni muktadha wa tokeni za 1M
  • Uwezo bora wa uelekezaji wa multimodal: Nzuri katika usindikaji wa data ya modali nyingi, kwa sasa inasaidia pembejeo za aina nyingi na uingizaji wa maandishi wa modali moja
  • Upanuzi wa kipengele cha siku zijazo: Uundaji wa picha na vitendaji vya kubadilisha maandishi-hadi-hotuba vitapatikana hivi karibuni
  • Upatikanaji: Iliyotolewa rasmi kwenye Vertex AI Studio na majukwaa ya Google AI Studio, na inaweza kufikiwa kupitia Gemini API.

Gemini 2.0 Flash-Lite (Onyesho la kukagua)

Kama kielelezo "cha gharama nafuu zaidi", Flash-Lite inatoa usawa bora kati ya kasi, gharama na utendakazi.

  • Manufaa ya gharama nafuu: Huku ikidumisha kasi na gharama sawa na Flash 1.5, ina ubora zaidi wa Flash 1.5 katika majaribio mengi ya benchmark.
  • Dirisha la muktadha wa kiwango cha milioni: Pia inasaidia tokeni 1M za nguvu ya kuchakata muktadha.

Kulingana na ulinganisho wa tathmini ya utendakazi uliotolewa na Google, toleo la Majaribio la Gemini 2.0 Pro lilipata alama za juu zaidi katika takriban majaribio yote ya kiwango, likifanya vyema zaidi:

Ilifanya vyema hasa katika kazi za kutengeneza msimbo (kama vile LiveCodeBench v5) na matatizo changamano ya hisabati (kama vile aljebra, jiometri na calculus). Kwa kuongezea, kulikuwa na uboreshaji mkubwa katika mtihani wa kuelewa hati ngumu ndefu.

Na bei

Google pia ni mtengenezaji makini kulingana na ufaafu wa gharama wa API.

Tokeni milioni za Gemini 2.0 za Flash zinagharimu chini ya dola moja... Inaauni hali nyingi, utafutaji wa mtandao na dirisha la muktadha ambalo halijawahi kushuhudiwa.

Kwa kulinganisha, Deepseek V3 kwa sasa inagharimu dola moja kwa tokeni milioni moja, na makisio ya R1 yanagharimu dola nne.

PS: Lakini bado nataka kuwashukuru DeepSeek kwa kupunguza bei. Yeyote anayeweza kupunguza bei ni familia.

Hii ni nafuu sana! Ikilinganishwa na utendaji, nadhani kile Gemini kimepuuzwa ni bei!

Utendaji wa kesi

Kwa kuwa inadai kuwa nzuri kama Deepseek, hakika lazima tuone jinsi inavyofanya kazi katika kesi na kuona jinsi watumiaji wa mtandao mbalimbali wameijaribu.

Mchezo wa mpira wa pini unaotegemea fizikia

Hebu kwanza tuangalie kisa hiki maarufu, ambacho hutumia injini ya fizikia kuiga athari halisi kama vile migongano, msuguano, na mvuto.

Kidokezo: Andika programu ya Python inayoonyesha mpira unaodunda ndani ya hexagons inayozunguka. Mpira unapaswa kuathiriwa na mvuto na msuguano, na lazima uruke kihalisi kutoka kwa kuta zinazozunguka.

Hivi ndivyo Deepseek R1 na o3-min hufanya:

Toleo lililotolewa na Gemini 2.0 Pro Jaribio:

Aina mbili zilizobaki hazifanyi kazi vizuri

Ugumu mara mbili! Fanya mpira ugawanywe katika mipira 100!

Kidokezo: Andika hati ya mipira 100 ya manjano nyangavu inayodunda ndani ya duara, uhakikishe kushughulikia utambuzi wa mgongano kwa usahihi. Fanya tufe kuzunguka polepole. Hakikisha mipira inakaa ndani ya tufe. Tekeleza katika p5.js

Umefanya vizuri! Mzunguko wa polepole wa nyanja ni laini sana, na simulation ya sheria za kimwili ni bora. Mipira 100 pia inagongana kwa kasi na "inafanya kazi zao" ~

Andika hati ya p5.js ili kuiga chembe 25 zinazorukaruka katika nafasi ya utupu ndani ya chombo cha silinda. Tumia rangi tofauti kwa kila mpira na uhakikishe kuwa wanaacha njia ili kuonyesha harakati zao. Ongeza mzunguko wa polepole wa kontena ili kutazama vyema kile kinachotokea katika eneo la tukio. Hakikisha umeunda ugunduzi unaofaa wa mgongano na sheria za fizikia ili kuhakikisha kuwa chembe zinasalia ndani ya kontena. Ongeza chombo cha nje cha duara. Ongeza athari ya kuvuta ndani na nje ya polepole kwenye eneo zima.

Swali la mtihani wa sitroberi ambalo haliwezi kuepukika

Na watumiaji wa mitandao wajanja (wajanja) wametupa jaribio la kawaida la sitroberi tena:

Kuna r ngapi kwenye strawberry

Na Gemini 2.0 Flash Thinking Jaribio lilipata jibu sawa:

Bosi wa Google Jeff Dean alijaribu ujuzi wake wa kupanga programu

Jeff Dean, mwanasayansi mkuu katika Google DeepMind na Utafiti wa Google, pia alijaribu ujuzi wa upangaji wa wimbi la Gemini 2.0 Pro:

Alikuwa na mtindo kukamilisha mchezo classic Boggle, na kanuni zinazozalishwa mara ya kwanza kukamilika kutafuta maneno yote halali katika "barua mraba" mchezo:

Kwa kuongezea, Jeff Dean alisema kwamba nambari hiyo ilikamilika kwa sekunde 18.9 tu, ambayo ni haraka sana.

Mkurugenzi Mtendaji wa Google DeepMind ana imani tele na sasisho hili kuu la muundo, akisema kuwa toleo hili linaweka msingi kwa Google kufikia kazi ya baadaye ya wakala mahiri:

Mkurugenzi Mtendaji wa Google Sundar Pichai hapo awali aliweka wazi kuwa 2025 itakuwa kipindi muhimu kwa Google kuharakisha maendeleo katika uwanja wa AI. Inahisi kama baada ya toleo hili, njia ya Google inakuwa wazi zaidi!

Ikilinganishwa na njia za makubwa mengine, njia ya AI ya Google inalenga zaidi juu ya vitendo na hutoa moja kwa moja chaguo nyingi za matoleo, kama vile kisanduku cha zana cha AI, ambapo unaweza kuchagua na kuchagua upendavyo, kulingana na mahitaji yako, rahisi na rahisi, na kuweza kukidhi mahitaji ya kila aina.

Machapisho Yanayofanana

Toa Jibu

Barua-pepe haitachapishwa. Fildi za lazima zimetiwa alama ya *