Google het drie nuwe modelle gelyktydig vrygestel: Gemini-2.0-Pro is gratis, het 'n uitstekende telling en is eerste, en is geskik vir die kodering en verwerking van komplekse opdragte!

Die storie van Gemi n ek 2.0 besig is om te versnel.

Die Flash Thinking Experimental-weergawe in Desember het ontwikkelaars 'n werkende model met lae latensie en hoë werkverrigting gebring.

Vroeër vanjaar is 2.0 Flash Thinking Experimental in die Google AI Studio opgedateer om werkverrigting verder te verbeter deur die spoed van Flash met verbeterde afleidingsvermoëns te kombineer.

Verlede week is die opgedateerde weergawe 2.0 Flash volledig op die Gemini-rekenaar- en mobiele toepassings bekendgestel.

Vandag is drie nuwe lede terselfdertyd onthul: die eksperimentele weergawe van Gemini 2.0 Pro, wat tot dusver die beste gevaar het in kodering en komplekse opdragte, die kostedoeltreffende 2.0 Flash-Lite, en die denkverbeterde weergawe 2.0 Flash Thinking.

Gemini 2.0 Pro is eerste in alle kategorieë. Gemini-2.0-Flash is onder die top drie in kodering, wiskunde en legkaarte. Flash-lite is in die top tien in alle kategorieë.

'n Vergelykingskaart van die drie modelle se vermoëns:

Alle modelle ondersteun multimodale invoer- en uitvoerteks.

Meer modale vermoëns is op pad. Modelsterktekaart in die koderingsarena

Wentempo hittekaart

Google behandel gratis gebruikers beter as wat OpenAI Plus-gebruikers behandel. Gratis toegang tot Gemini 2.0 Pro Experimental in AI Studio:

Klik om te speel

Deepseek-diens wys altyd 'n fout wat wag ... Onthou dat die eerste afleidingsvrye model ook 2.0 Flash Thinking was, wat in Google aistudio gebruik is.

Daarbenewens is daar die web weergawe van Gemini:

Daar is ook 'n gekoppelde afleidingsmodel (so hoekom skei dit ...)

Google het die eksperimentele weergawe van Gemini 2.0 Pro vrygestel, en die verbetering in amptelike maatstaftoetse is nogal opvallend.

Dit het die kragtigste koderingsvermoëns en die vermoë om komplekse opdragte te verwerk, en het 'n beter vermoë om wêreldkennis te verstaan en te redeneer as enige model wat tot dusver deur Google vrygestel is.

Dit het die grootste konteksvenster (200k, en my lang konteks is 'n relatief groot voordeel van die Gemini-model), wat dit in staat stel om 'n groot hoeveelheid inligting omvattend te ontleed en te verstaan, en om nutsmiddels soos Google-soektog en kode-uitvoering te bel.

In die MATH-toets het dit 91.8% behaal, 'n toename van ongeveer 5 persentasiepunte teenoor weergawe 1.5. GPQA-redenasievermoë het 64.7% bereik, en SimpleQA-wêreldkennistoets het selfs 44.3% bereik.

Die mees opvallende is die programmeringsvermoë. Dit het 36.0% in die LiveCodeBench-toets behaal, en die Bird-SQL-omskakelingsakkuraatheid het 59.3% oorskry. Tesame met die supergroot konteksvenster van 2 miljoen tokens, is dit genoeg om die mees komplekse kode-ontledingstake te hanteer.

Jy kan dit met die wyser probeer.

Die meertalige begripsvermoë is ook indrukwekkend, met 'n Global MMLU-toetstelling van 86.5%. Beeldbegrip MMMU is 72.7%, en video-ontledingsvermoë is 71.9%.

Gemini 2.0 Flash-Lite is 'n interessante balans.

Dit handhaaf die spoed en koste van 1,5 Flash, maar bring beter werkverrigting. Die konteksvenster met 1 miljoen tokens laat dit toe om meer inligting te verwerk.

Die mees praktiese ding is die prys/prestasie-verhouding: die generering van byskrifte vir 40 000 foto's kos minder as $1. Dit maak KI meer plat op die aarde.

Blogger Shrivastava het genoem: Gemini 2.0 Pro-enkodering is mal!

Wenk: gebruik Three.js om 'n sonnestelselsimulasie te skep. Voeg 'n tydskaal, 'n fokus-aftrekkieslys by, wys wentelbane en wys etikette. Skep alles in een lêer sodat ek dit in 'n aanlynredigeerder kan plak en die uitvoer kan bekyk.

Daarbenewens het sommige gebruikers genoem dat Gemini 2.0 Flash beter resultate gelewer het in een van sy eie paradokstoetse:

Ten slotte het Google genoem dat die sekuriteit van Gemini 2.0, nie net die pleister nie, van die begin af die kern van die ontwerp is.

Laat die model leer om selfkrities te wees. Gebruik versterkingsleer om Tweeling sy eie antwoorde te laat evalueer en meer akkurate terugvoer te gee. Dit maak dit meer robuust wanneer jy met sensitiewe onderwerpe handel.

Die outomatiese rooispantoetsing is interessant. Dit is spesifiek ontwerp om die inspuiting van indirekte vinnige woorde te voorkom, wat is soos om die KI toe te rus met 'n immuunstelsel om te verhoed dat iemand kwaadwillige opdragte in die data wegsteek.

Ongekategoriseer

Hoe is DeepSeek geskep? 'n Ontleding van DeepSeek se groeigeskiedenis

Deurzddeepseeker 3 Februarie 20253 Februarie 2025

In die toekoms sal daar meer en meer hardcore-innovasie wees. Dit is dalk nie nou maklik om te verstaan nie, want die hele sosiale groep moet deur feite opgevoed word. Wanneer hierdie samelewing mense wat hardcore innoveer toelaat om sukses te behaal, sal die kollektiewe ingesteldheid verander. Ons het net 'n klomp feite en 'n proses nodig ....

Ongekategoriseer

DeepSeek R1 het eerste gekom in die kreatiewe skryftoets, en o3 mini was selfs slegter as o1 mini!

Deurzddeepseeker 3 Februarie 20253 Februarie 2025

DeepSeek R1 het die kampioenskap gewen in die kreatiewe kortverhaalskryf-maatstaftoets, wat die vorige dominante speler Claude 3.5 Sonnet suksesvol oortref het! Normtoets Die maatstaftoets wat deur navorser Lech Mazur ontwerp is, is nie jou gemiddelde skryfkompetisie nie. Elke KI-model moes 500 kortverhale voltooi, en elke storie moes slim insluit ...

Ongekategoriseer

Cathie Wood: DeepSeek versnel net die kosteverminderingsproses; die uiterste gekonsentreerde markstruktuur vergelykbaar met die Groot Depressie sal verander

Deurzddeepseeker 8 Februarie 20258 Februarie 2025

Hoogtepunte Mededinging met DeepSeek is goed vir die VSA Cathie Wood: Ek dink dit wys dat die koste van innovasie dramaties daal, en dat hierdie neiging reeds begin het. Byvoorbeeld, voor DeepSeek het die koste van opleiding van kunsmatige intelligensie met 75% per jaar gedaal, en die koste van afleiding het selfs met 85% gedaal tot ...

Ongekategoriseer

DeepSeek TOP17 Beste Alternatiewe: Omvattende Analise (2025)

Deurdeepseeker 6 Februarie 20256 Februarie 2025

Inleiding In die vinnig ontwikkelende landskap van kunsmatige intelligensie het DeepSeek as 'n kragtige taalmodel na vore gekom. Hierdie omvattende ontleding ondersoek die top 17 alternatiewe vir DeepSeek, en ondersoek hul unieke kenmerke, vermoëns en gebruiksgevalle. Ons navorsing fokus op beide internasionale en Chinese platforms wat DeepSeek-integrasie of soortgelyke vermoëns bied. Top Alternatiewe Ontleding 1….

Ongekategoriseer

Brekende nuus! DeepSeek-navorser onthul aanlyn: R1-opleiding het slegs twee tot drie weke geneem, en 'n kragtige evolusie van R1 nul is tydens die Chinese Nuwejaarsvakansie waargeneem

Deurzddeepseeker 4 Februarie 20254 Februarie 2025

Brekende nuus! DeepSeek-navorser onthul aanlyn: R1-opleiding het net twee tot drie weke geneem, en 'n kragtige evolusie van R1 nul is tydens die Chinese Nuwejaarsvakansie waargeneem. Ons het nou opgemerk dat DeepSeek-navorser Daya Guo op netgebruikers se vrae oor DeepSeek R1 en die maatskappy se planne gereageer het vorentoe. Ons kan net sê...

Ongekategoriseer

Wat kan Deepseek bereik? Selfs OpenAI kan dit nie doen nie?

Deurzddeepseeker 10 Februarie 202510 Februarie 2025

Die ware waarde van DeepSeek word onderskat! DeepSeek-R1 het ongetwyfeld 'n nuwe golf van entoesiasme na die mark gebring. Nie net styg die betrokke sogenaamde begunstigde-teikens skerp nie, maar sommige mense het selfs DeepSeek-verwante kursusse en sagteware ontwikkel in 'n poging om geld daaruit te maak. Ons glo dat hoewel hierdie verskynsels 'n ...

Soortgelyke plasings

Maak 'n opvolg-bydrae Kanselleer die opvolg-bydrae