Nekategorizirano - Deepseek R1

Tajna iza DeepSeek 1 | DeepSeekMmatematika i GRPO detalji

Nekategorizirano

Tajna iza DeepSeek 1 | DeepSeekMmatematika i GRPO detalji

Pozddeepseeker 9. veljače 20259. veljače 2025

Danas bih želio podijeliti članak iz DeepSeek pod naslovom DeepSeekMath: Pomicanje granica matematičkog zaključivanja u modelima otvorenog jezika. Ovaj članak predstavlja DeepSeekMath 7B, koji je unaprijed obučen na DeepSeek-Coder-Base-v1.5 7B na temelju zbirke od 120B tokena povezanih s matematikom, prirodnim jezikom i podacima koda. Model je postigao zadivljujući rezultat od 51,7% na natjecateljskoj razini…

Nekategorizirano

Otkrivena tehnologija DeepSeek-R1: temeljni principi papira su raščlanjeni i otkriven je ključ revolucionarne izvedbe modela

Pozddeepseeker 9. veljače 20259. veljače 2025

Danas ćemo podijeliti DeepSeek R1, naslov: DeepSeek-R1: Poticanje sposobnosti rasuđivanja u LLM-u putem dodatnog učenja: Poticanje sposobnosti rasuđivanja u LLM-u putem učenja s pojačanjem. Ovaj rad predstavlja prvu generaciju modela rezoniranja DeepSeek, DeepSeek-R1-Zero i DeepSeek-R1. Model DeepSeek-R1-Zero obučen je kroz opsežno učenje pojačanja (RL) bez nadziranog finog podešavanja (SFT) kao početni korak,…

Nekategorizirano

DeepSeek R1 tumačenje papira i ključne tehničke točke

Pozddeepseeker 9. veljače 20259. veljače 2025

1 Pozadina Tijekom Proljetnog festivala, DeepSeek R1 je još jednom privukao široku pozornost, a čak je i članak o tumačenju DeepSeek V3 koji smo prethodno napisali također ponovno prenošen io njemu se mnogo raspravljalo. Iako je bilo mnogo analiza i reprodukcija DeepSeek R1, ovdje smo odlučili sastaviti neke odgovarajuće bilješke za čitanje. Koristit ćemo tri…

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Nekategorizirano

Googleov jeftini model, serija Gemini 2.0, napada: borba za isplativost kod velikih modela se zaoštrava

Pozddeepseeker 8. veljače 20258. veljače 2025

Visoka cijena korištenja velikih AI modela glavni je razlog zašto mnoge AI aplikacije još nisu implementirane i promovirane. Odabir ekstremnih performansi znači velike troškove računalne snage, što dovodi do visokih troškova korištenja koje obični korisnici ne mogu prihvatiti. Natjecanje za velike AI modele je poput rata bez dima. Nakon…

Gemini 2.0 dominira ljestvicama, dok DeepSeek V3 plače zbog svoje cijene, a novi isplativi prvak je rođen!

Nekategorizirano

Gemini 2.0 dominira ljestvicama, dok DeepSeek V3 plače zbog svoje cijene, a novi isplativi prvak je rođen!

Pozddeepseeker 8. veljače 20258. veljače 2025

Obitelj Google Gemini 2.0 konačno je kompletirana! Dominira top listama čim se objavi. Usred potjere i blokada Deepseeka, Qwena i o3, Google je rano jutros u jednom potezu objavio tri modela: Gemini 2.0 Pro, Gemini 2.0 Flash i Gemini 2.0 Flash-Lite. Na ljestvici velikog modela LMSYS, Gemini…

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

Nekategorizirano

a16z dijalog s 27-godišnjim izvršnim direktorom: AI Agent ima ogroman učinak poluge, a dugoročne cijene bit će povezane s troškovima rada

Pozddeepseeker 8. veljače 20258. veljače 2025

Istaknuto AI Agent preoblikuje korisničko iskustvo Jesse Zhang: Kako je agent zapravo konstruiran? Naše je mišljenje da će s vremenom sve više nalikovati agentu temeljenom na prirodnom jeziku jer se tako obučavaju veliki jezični modeli (LLM). Dugoročno gledano, ako imate super inteligentnog agenta koji...

Nekategorizirano

Cathie Wood: DeepSeek samo ubrzava proces smanjenja troškova; promijenit će se ekstremno koncentrirana tržišna struktura usporediva s Velikom depresijom

Pozddeepseeker 8. veljače 20258. veljače 2025

Izdvajamo Konkurencija s DeepSeek je dobra za SAD Cathie Wood: Mislim da pokazuje da cijena inovacije dramatično pada i da je taj trend već započeo. Na primjer, prije DeepSeek, cijena obuke umjetne inteligencije pala je za 75% godišnje, a cijena zaključivanja čak je pala za 85% na…

Nekategorizirano

Google je objavio tri nova modela odjednom: Gemini-2.0-Pro je besplatan, ima izvrsnu ocjenu i prvi je na ljestvici, a prikladan je za kodiranje i obradu složenih upita!

Pozddeepseeker 8. veljače 20258. veljače 2025

Priča o Geminiju 2.0 ubrzava se. Flash Thinking Experimental verzija u prosincu je programerima donijela radni model s niskom latencijom i visokim performansama. Ranije ove godine, 2.0 Flash Thinking Experimental ažuriran je u Google AI Studiju kako bi se dodatno poboljšala izvedba kombiniranjem brzine Flasha s poboljšanim mogućnostima zaključivanja. Prošli tjedan,…

DeepSeek TOP17 najboljih alternativa: Sveobuhvatna analiza (2025.)

Nekategorizirano

DeepSeek TOP17 najboljih alternativa: Sveobuhvatna analiza (2025.)

Podeepseeker 6. veljače 20256. veljače 2025

Uvod U krajoliku umjetne inteligencije koji se brzo razvija, DeepSeek se pojavio kao moćan jezični model. Ova sveobuhvatna analiza istražuje 17 najboljih alternativa za DeepSeek, ispitujući njihove jedinstvene značajke, mogućnosti i slučajeve korištenja. Naše istraživanje usmjereno je na međunarodne i kineske platforme koje nude integraciju DeepSeek ili slične mogućnosti. Analiza najboljih alternativa 1….

Nekategorizirano

Ali Qwen2.5-Max prestigao DeepSeek-V3! Netizen: Kineska umjetna inteligencija brzo smanjuje jaz

Pozddeepseeker 5. veljače 20255. veljače 2025

Upravo je još jedan domaći model dodan na listu Big Model Arena iz Alija, Qwen2.5-Max, koji je nadmašio DeepSeek-V3 i zauzeo sedmo mjesto u ukupnoj ljestvici s ukupnom ocjenom od 1332. Također je nadmašio modele kao što su Claude 3.5 Sonnet i Llama 3.1 405B u jednom potezu. Posebno se ističe u programiranju…