zddeepseeker - Deepseek R1 - Stranica 2 od 3

Nekategorizirano

Otkrivena tehnologija DeepSeek-R1: temeljni principi papira su raščlanjeni i otkriven je ključ revolucionarne izvedbe modela

Pozddeepseeker 9. veljače 20259. veljače 2025

Danas ćemo podijeliti DeepSeek R1, naslov: DeepSeek-R1: Poticanje sposobnosti rasuđivanja u LLM-u putem dodatnog učenja: Poticanje sposobnosti rasuđivanja u LLM-u putem učenja s pojačanjem. Ovaj rad predstavlja prvu generaciju modela rezoniranja DeepSeek, DeepSeek-R1-Zero i DeepSeek-R1. Model DeepSeek-R1-Zero obučen je kroz opsežno učenje pojačanja (RL) bez nadziranog finog podešavanja (SFT) kao početni korak,…

Nekategorizirano

DeepSeek R1 tumačenje papira i ključne tehničke točke

Pozddeepseeker 9. veljače 20259. veljače 2025

1 Pozadina Tijekom Proljetnog festivala, DeepSeek R1 je još jednom privukao široku pozornost, a čak je i članak o tumačenju DeepSeek V3 koji smo prethodno napisali također ponovno prenošen io njemu se mnogo raspravljalo. Iako je bilo mnogo analiza i reprodukcija DeepSeek R1, ovdje smo odlučili sastaviti neke odgovarajuće bilješke za čitanje. Koristit ćemo tri…

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Nekategorizirano

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Pozddeepseeker 8. veljače 20258. veljače 2025

Visoka cijena korištenja velikih AI modela glavni je razlog zašto mnoge AI aplikacije još nisu implementirane i promovirane. Odabir ekstremnih performansi znači velike troškove računalne snage, što dovodi do visokih troškova korištenja koje obični korisnici ne mogu prihvatiti. Natjecanje za velike AI modele je poput rata bez dima. Nakon…

Gemini 2.0 dominira ljestvicama, dok DeepSeek V3 plače zbog svoje cijene, a novi isplativi prvak je rođen!

Nekategorizirano

Gemini 2.0 dominira ljestvicama, dok DeepSeek V3 plače zbog svoje cijene, a novi isplativi prvak je rođen!

Pozddeepseeker 8. veljače 20258. veljače 2025

Obitelj Google Gemini 2.0 konačno je kompletirana! Dominira top listama čim se objavi. Usred potjere i blokada Deepseeka, Qwena i o3, Google je rano jutros u jednom potezu objavio tri modela: Gemini 2.0 Pro, Gemini 2.0 Flash i Gemini 2.0 Flash-Lite. Na ljestvici velikog modela LMSYS, Gemini…

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

Nekategorizirano

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

Pozddeepseeker 8. veljače 20258. veljače 2025

Istaknuto AI Agent preoblikuje korisničko iskustvo Jesse Zhang: Kako je agent zapravo konstruiran? Naše je mišljenje da će s vremenom sve više nalikovati agentu temeljenom na prirodnom jeziku jer se tako obučavaju veliki jezični modeli (LLM). Dugoročno gledano, ako imate super inteligentnog agenta koji...

Nekategorizirano

Cathie Wood: DeepSeek samo ubrzava proces smanjenja troškova; promijenit će se ekstremno koncentrirana tržišna struktura usporediva s Velikom depresijom

Pozddeepseeker 8. veljače 20258. veljače 2025

Izdvajamo Konkurencija s DeepSeek je dobra za SAD Cathie Wood: Mislim da pokazuje da cijena inovacije dramatično pada i da je taj trend već započeo. Na primjer, prije DeepSeek, cijena obuke umjetne inteligencije pala je za 75% godišnje, a cijena zaključivanja čak je pala za 85% na…

Nekategorizirano

Google je objavio tri nova modela odjednom: Gemini-2.0-Pro je besplatan, ima izvrsnu ocjenu i prvi je na ljestvici, a prikladan je za kodiranje i obradu složenih upita!

Pozddeepseeker 8. veljače 20258. veljače 2025

Priča o Geminiju 2.0 ubrzava se. Flash Thinking Experimental verzija u prosincu je programerima donijela radni model s niskom latencijom i visokim performansama. Ranije ove godine, 2.0 Flash Thinking Experimental ažuriran je u Google AI Studiju kako bi se dodatno poboljšala izvedba kombiniranjem brzine Flasha s poboljšanim mogućnostima zaključivanja. Prošli tjedan,…

Nekategorizirano

Ali Qwen2.5-Max prestigao DeepSeek-V3! Netizen: Kineska umjetna inteligencija brzo smanjuje jaz

Pozddeepseeker 5. veljače 20255. veljače 2025

Upravo je još jedan domaći model dodan na listu Big Model Arena iz Alija, Qwen2.5-Max, koji je nadmašio DeepSeek-V3 i zauzeo sedmo mjesto u ukupnoj ljestvici s ukupnom ocjenom od 1332. Također je nadmašio modele kao što su Claude 3.5 Sonnet i Llama 3.1 405B u jednom potezu. Posebno se ističe u programiranju…

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Nekategorizirano

Udarne vijesti! Istraživač DeepSeek otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika

Pozddeepseeker 4. veljače 20254. veljače 2025

Udarne vijesti! DeepSeek istraživač otkriva na mreži: R1 obuka trajala je samo dva do tri tjedna, a snažna evolucija R1 zero primijećena je tijekom kineskih novogodišnjih praznika Upravo smo primijetili da je DeepSeek istraživač Daya Guo odgovorio na pitanja korisnika interneta o DeepSeek R1 i planovima tvrtke ide naprijed. Možemo samo reći…

DeepSeek R1 je bio prvi u testu kreativnog pisanja, a o3 mini bio je još lošiji od o1 mini!

Nekategorizirano

DeepSeek R1 je bio prvi u testu kreativnog pisanja, a o3 mini bio je još lošiji od o1 mini!

Pozddeepseeker 3. veljače 20253. veljače 2025

DeepSeek R1 osvojio je prvenstvo u referentnom testu kreativnog pisanja kratkih priča, uspješno nadmašivši prethodnog dominantnog igrača Claude 3.5 Sonnet! Benchmark test Benchmark test koji je osmislio istraživač Lech Mazur nije vaše prosječno natjecanje u pisanju. Svaki model umjetne inteligencije trebao je dovršiti 500 kratkih priča, a svaka je priča morala pametno uključiti...