Google je objavio tri nova modela odjednom: Gemini-2.0-Pro je besplatan, ima izvrsnu ocjenu i nalazi se na prvom mjestu te je prikladan za kodiranje i obradu složenih upita!

Priča o Gemi n ja 2.0 se ubrzava.

Flash Thinking Experimental verzija u prosincu je programerima donijela radni model s niskom latencijom i visokim performansama.

Ranije ove godine, 2.0 Flash Thinking Experimental ažuriran je u Google AI Studiju kako bi se dodatno poboljšala izvedba kombiniranjem brzine Flasha s poboljšanim mogućnostima zaključivanja.

Prošlog je tjedna ažurirana verzija 2.0 Flasha u potpunosti pokrenuta na Gemini desktop i mobilnim aplikacijama.

Danas su istovremeno predstavljena tri nova člana: eksperimentalna verzija Gemini 2.0 Pro, koja se do sada najbolje pokazala u kodiranju i složenim upitima, isplativa 2.0 Flash-Lite i verzija 2.0 Flash Thinking s poboljšanim načinom razmišljanja.

Gemini 2.0 Pro zauzima prvo mjesto u svim kategorijama. Gemini-2.0-Flash je među prva tri u kodiranju, matematici i zagonetkama. Flash-lite se nalazi među prvih deset u svim kategorijama.

Usporedna tablica sposobnosti triju modela:

Svi modeli podržavaju multimodalni unos i izlaz teksta.

Još modalnih mogućnosti je na putu. Grafikon snage modela u areni kodiranja

Toplinska karta stope pobjede

Google se prema besplatnim korisnicima odnosi bolje nego OpenAI prema Plus korisnicima. Besplatan pristup Gemini 2.0 Pro Experimental u AI Studiju:

Kliknite za igru

Usluga Deepseek uvijek prikazuje pogrešku na čekanju… Zapamtite da je prvi model bez zaključivanja također bio 2.0 Flash Thinking, koji je korišten u Google aistudio.

Osim toga, tu je i web verzija Geminija:

Postoji i povezani model zaključivanja (pa zašto ga razdvajati…)

Google je objavio eksperimentalnu verziju Gemini 2.0 Pro, a napredak u službenim benchmark testovima je prilično upečatljiv.

Ima najsnažnije mogućnosti kodiranja i sposobnost obrade složenih upita te ima bolju sposobnost razumijevanja i zaključivanja o svjetskom znanju od bilo kojeg modela koji je dosad objavio Google.

Ima najveći kontekstni prozor (200k, a moj dugi kontekst je relativno velika prednost Gemini modela), što mu omogućuje sveobuhvatnu analizu i razumijevanje velike količine informacija, te pozivanje alata poput Google pretraživanja i izvršavanje koda.

U MATH testu postigao je 91,8%, što je povećanje od oko 5 postotnih bodova u odnosu na verziju 1.5. GPQA sposobnost rasuđivanja dosegla je 64,7%, a SimpleQA test znanja o svijetu čak 44,3%.

Najistaknutija je sposobnost programiranja. Postigao je 36.0% u LiveCodeBench testu, a točnost Bird-SQL konverzije premašila je 59.3%. Zajedno sa super-velikim kontekstnim prozorom od 2 milijuna tokena, dovoljno je za rješavanje najsloženijih zadataka analize koda.

Možete isprobati u pokazivaču.

Sposobnost razumijevanja više jezika također je impresivna, s rezultatom Global MMLU testa od 86,5%. Razumijevanje slike MMMU je 72.7%, a sposobnost analize videa je 71.9%.

Gemini 2.0 Flash-Lite je zanimljiva ravnoteža.

Zadržava brzinu i cijenu 1.5 Flasha, ali donosi bolje performanse. Kontekstni prozor s 1 milijun tokena omogućuje obradu više informacija.

Najpraktičniji je njegov omjer cijene i učinka: generiranje naslova za 40.000 fotografija košta manje od $1. To čini umjetnu inteligenciju prizemnijom.

Bloger Shrivastava je spomenuo: Gemini 2.0 Pro kodiranje je ludo!

Savjet: koristite Three.js za izradu simulacije solarnog sustava. Dodajte vremensku ljestvicu, padajući izbornik fokusa, prikažite orbite i prikažite oznake. Stvorite sve u jednoj datoteci tako da je mogu zalijepiti u uređivač na mreži i vidjeti izlaz.

Osim toga, neki su korisnici spomenuli da je Gemini 2.0 Flash dao bolje rezultate u jednom od njegovih paradoks testova:

Konačno, Google je spomenuo da je sigurnost Geminija 2.0, a ne samo zakrpa, u srži dizajna od samog početka.

Neka model nauči biti samokritičan. Upotrijebite učenje s potkrepljenjem kako biste dopustili Blizancima da procijene vlastite odgovore i daju točnije povratne informacije. To ga čini robusnijim kada se radi o osjetljivim temama.

Zanimljivo je automatizirano testiranje crvenog tima. Posebno je dizajniran da spriječi ubacivanje neizravnih brzih riječi, što je poput opremanja umjetne inteligencije imunološkim sustavom kako bi se spriječilo da netko sakrije zlonamjerne naredbe u podacima.

Nekategorizirano

Što je FlashMLA? Sveobuhvatni vodič o njegovom utjecaju na AI dekodiranje kernela

Podeepseeker 24. veljače 202524. veljače 2025

FlashMLA je brzo privukao pozornost u svijetu umjetne inteligencije, posebno u području velikih jezičnih modela (LLM). Ovaj inovativni alat, koji je razvio DeepSeek, služi kao optimizirana jezgra za dekodiranje dizajnirana za Hopper GPU-ove—čipove visokih performansi koji se obično koriste u AI računanjima. FlashMLA se fokusira na učinkovitu obradu sekvenci promjenjive duljine, što ga čini posebno pogodnim za...

Nekategorizirano

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Pozddeepseeker 4. veljače 20254. veljače 2025

Udarne vijesti! DeepSeek istraživač otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika Upravo smo primijetili da je DeepSeek istraživač Daya Guo odgovorio na pitanja korisnika interneta o DeepSeek R1 i planovima tvrtke ide naprijed. Možemo samo reći…

Nekategorizirano

Altman: Pogriješili smo u vezi umjetne inteligencije otvorenog koda! DeepSeek je učinio OpenAI manje povoljnim, a sljedeći je GPT-5

Pozddeepseeker 1. veljače 20251. veljače 2025

o3-mini stigao je kasno u noć, a OpenAI je konačno otkrio svoj najnoviji adut. Tijekom Reddit AMA pitanja i odgovora, Altman je duboko priznao da je stajao na pogrešnoj strani umjetne inteligencije otvorenog koda. Rekao je da se razmatra interna strategija otvorenog koda, te će se model nastaviti razvijati, ali…

Nekategorizirano

DeepSeek R1 tumačenje papira i ključne tehničke točke

Pozddeepseeker 9. veljače 20259. veljače 2025

1 Pozadina Tijekom Proljetnog festivala, DeepSeek R1 je još jednom privukao široku pozornost, a čak je i članak o tumačenju DeepSeek V3 koji smo prethodno napisali također ponovno prenošen io njemu se mnogo raspravljalo. Iako je bilo mnogo analiza i reprodukcija DeepSeek R1, ovdje smo odlučili sastaviti neke odgovarajuće bilješke za čitanje. Koristit ćemo tri…

Nekategorizirano

Otkrivena tehnologija DeepSeek-R1: temeljni principi papira su raščlanjeni i otkriven je ključ revolucionarne izvedbe modela

Pozddeepseeker 9. veljače 20259. veljače 2025

Danas ćemo podijeliti DeepSeek R1, naslov: DeepSeek-R1: Poticanje sposobnosti rasuđivanja u LLM-u putem dodatnog učenja: Poticanje sposobnosti rasuđivanja u LLM-u putem učenja s pojačanjem. Ovaj rad predstavlja prvu generaciju modela rezoniranja DeepSeek, DeepSeek-R1-Zero i DeepSeek-R1. Model DeepSeek-R1-Zero obučen je kroz opsežno učenje pojačanja (RL) bez nadziranog finog podešavanja (SFT) kao početni korak,…

Nekategorizirano

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Pozddeepseeker 8. veljače 20258. veljače 2025

Visoka cijena korištenja velikih AI modela glavni je razlog zašto mnoge AI aplikacije još nisu implementirane i promovirane. Odabir ekstremnih performansi znači velike troškove računalne snage, što dovodi do visokih troškova korištenja koje obični korisnici ne mogu prihvatiti. Natjecanje za velike AI modele je poput rata bez dima. Nakon…

Google je objavio tri nova modela odjednom: Gemini-2.0-Pro je besplatan, ima izvrsnu ocjenu i prvi je na ljestvici, a prikladan je za kodiranje i obradu složenih upita!

Što je FlashMLA? Sveobuhvatni vodič o njegovom utjecaju na AI dekodiranje kernela

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Altman: Pogriješili smo u vezi umjetne inteligencije otvorenog koda! DeepSeek je učinio OpenAI manje povoljnim, a sljedeći je GPT-5

DeepSeek R1 tumačenje papira i ključne tehničke točke

Otkrivena tehnologija DeepSeek-R1: temeljni principi papira su raščlanjeni i otkriven je ključ revolucionarne izvedbe modela

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Odgovori Otkaži odgovor

Slični postovi

Odgovori Otkaži odgovor