Skrivnost za DeepSeek 1 | DeepSeekMmatematika in podrobnosti GRPO

Skrivnost za DeepSeek 1 | DeepSeekMmatematika in podrobnosti GRPO

Danes bi rad delil članek iz DeepSeek z naslovom DeepSeekMath: premikanje meja matematičnega sklepanja v modelih odprtega jezika. Ta članek predstavlja DeepSeekMath 7B, ki je vnaprej usposobljen na DeepSeek-Coder-Base-v1.5 7B, ki temelji na zbirki 120B žetonov, povezanih z matematiko, naravnega jezika in kodnih podatkov. Model je dosegel osupljivo oceno 51,7% na konkurenčni ravni…

Razkrita tehnologija DeepSeek-R1: temeljna načela papirja so razčlenjena in razkrit je ključ do prebojne zmogljivosti modela

Danes bomo delili DeepSeek R1, naslov: DeepSeek-R1: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja s krepitvijo: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja z okrepitvijo. Ta članek predstavlja prvo generacijo modelov razmišljanja DeepSeek, DeepSeek-R1-Zero in DeepSeek-R1. Model DeepSeek-R1-Zero je bil kot začetni korak usposobljen z obsežnim okrepitvenim učenjem (RL) brez nadzorovane natančne nastavitve (SFT), ...

Razlaga papirja DeepSeek R1 in ključne tehnične točke

1 Ozadje Med pomladnim festivalom je DeepSeek R1 znova pritegnil široko pozornost in celo članek o interpretaciji DeepSeek V3, ki smo ga napisali prej, je bil prav tako ponovno posredovan in o njem veliko razpravljali. Čeprav je bilo veliko analiz in reprodukcij DeepSeek R1, smo se tukaj odločili zbrati nekaj ustreznih opomb pri branju. Uporabili bomo tri…

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Visoki stroški uporabe velikih modelov umetne inteligence so glavni razlog, zakaj številne aplikacije umetne inteligence še niso bile implementirane in promovirane. Izbira ekstremne zmogljivosti pomeni velike stroške računalniške moči, kar vodi do visokih stroškov uporabe, ki jih navadni uporabniki ne morejo sprejeti. Tekmovanje za velike modele AI je kot vojna brez dima. Po…

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Družina Google Gemini 2.0 je končno dokončana! Na lestvicah prevladuje takoj, ko je izdan. Med preganjanjem in blokadami Deepseek, Qwen in o3 je Google zgodaj zjutraj izdal tri modele naenkrat: Gemini 2.0 Pro, Gemini 2.0 Flash in Gemini 2.0 Flash-Lite. Na lestvici velikega modela LMSYS je Gemini ...

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Poudarki AI Agent preoblikuje uporabniško izkušnjo Jesse Zhang: Kako je agent pravzaprav sestavljen? Naše mnenje je, da bo sčasoma vse bolj podoben agentu, ki temelji na naravnem jeziku, ker se tako usposabljajo veliki jezikovni modeli (LLM). Dolgoročno, če imate super inteligentnega agenta, ki ...

Cathie Wood: DeepSeek samo pospešuje proces zmanjševanja stroškov; ekstremno koncentrirana tržna struktura, primerljiva z veliko depresijo, se bo spremenila

Poudarki Konkurenca z DeepSeek je dobra za ZDA Cathie Wood: Mislim, da kaže, da stroški inovacij dramatično padajo in da se je ta trend že začel. Na primer, pred DeepSeek so stroški usposabljanja umetne inteligence padli za 75% na leto, stroški sklepanja pa celo za 85% na ...

Google je izdal tri nove modele naenkrat: Gemini-2.0-Pro je brezplačen, ima izjemen rezultat in je na prvem mestu ter je primeren za kodiranje in obdelavo zapletenih pozivov!

Zgodba o Gemini 2.0 se pospešuje. Različica Flash Thinking Experimental decembra je razvijalcem prinesla delujoč model z nizko zakasnitvijo in visoko zmogljivostjo. V začetku tega leta je bil 2.0 Flash Thinking Experimental posodobljen v Google AI Studio za nadaljnje izboljšanje zmogljivosti s kombinacijo hitrosti Flasha in izboljšanih zmožnosti sklepanja. Prejšnji teden,…

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

Uvod V hitro razvijajočem se okolju umetne inteligence se je DeepSeek izkazal kot močan jezikovni model. Ta celovita analiza raziskuje 17 najboljših alternativ za DeepSeek, preučuje njihove edinstvene lastnosti, zmogljivosti in primere uporabe. Naše raziskave se osredotočajo na mednarodne in kitajske platforme, ki ponujajo integracijo DeepSeek ali podobne zmogljivosti. Analiza najboljših alternativ 1….

Ali Qwen2.5-Max prehitel DeepSeek-V3! Netizen: Kitajska umetna inteligenca hitro zmanjšuje vrzel

Ravno zdaj je bil na seznam Big Model Arena družbe Ali dodan še en domači model, Qwen2.5-Max, ki je presegel DeepSeek-V3 in se uvrstil na sedmo mesto v skupni razvrstitvi s skupnim rezultatom 1332. Z enim zamahom je presegel tudi modela, kot sta Claude 3.5 Sonnet in Llama 3.1 405B. Predvsem se odlikuje v programiranju…