Nekategorizirano - Deepseek R1

Skrivnost za DeepSeek 1 | DeepSeekMmatematika in podrobnosti GRPO

Nekategorizirano

Skrivnost za DeepSeek 1 | DeepSeekMmatematika in podrobnosti GRPO

Avtor:zddeepseeker 9. februar 20259. februar 2025

Danes bi rad delil članek iz DeepSeek z naslovom DeepSeekMath: premikanje meja matematičnega sklepanja v modelih odprtega jezika. Ta članek predstavlja DeepSeekMath 7B, ki je vnaprej usposobljen na DeepSeek-Coder-Base-v1.5 7B, ki temelji na zbirki 120B žetonov, povezanih z matematiko, naravnega jezika in kodnih podatkov. Model je dosegel osupljivo oceno 51,7% na konkurenčni ravni…

Nekategorizirano

Razkrita tehnologija DeepSeek-R1: temeljna načela papirja so razčlenjena in razkrit je ključ do prebojne zmogljivosti modela

Avtor:zddeepseeker 9. februar 20259. februar 2025

Danes bomo delili DeepSeek R1, naslov: DeepSeek-R1: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja s krepitvijo: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja z okrepitvijo. Ta članek predstavlja prvo generacijo modelov razmišljanja DeepSeek, DeepSeek-R1-Zero in DeepSeek-R1. Model DeepSeek-R1-Zero je bil kot začetni korak usposobljen z obsežnim okrepitvenim učenjem (RL) brez nadzorovane natančne nastavitve (SFT), ...

Nekategorizirano

Razlaga papirja DeepSeek R1 in ključne tehnične točke

Avtor:zddeepseeker 9. februar 20259. februar 2025

1 Ozadje Med pomladnim festivalom je DeepSeek R1 znova pritegnil široko pozornost in celo članek o interpretaciji DeepSeek V3, ki smo ga napisali prej, je bil prav tako ponovno posredovan in o njem veliko razpravljali. Čeprav je bilo veliko analiz in reprodukcij DeepSeek R1, smo se tukaj odločili zbrati nekaj ustreznih opomb pri branju. Uporabili bomo tri…

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Nekategorizirano

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Avtor:zddeepseeker 8. februar 20258. februar 2025

Visoki stroški uporabe velikih modelov umetne inteligence so glavni razlog, zakaj številne aplikacije umetne inteligence še niso bile implementirane in promovirane. Izbira ekstremne zmogljivosti pomeni velike stroške računalniške moči, kar vodi do visokih stroškov uporabe, ki jih navadni uporabniki ne morejo sprejeti. Tekmovanje za velike modele AI je kot vojna brez dima. Po…

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Nekategorizirano

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Avtor:zddeepseeker 8. februar 20258. februar 2025

Družina Google Gemini 2.0 je končno dokončana! Na lestvicah prevladuje takoj, ko je izdan. Med preganjanjem in blokadami Deepseek, Qwen in o3 je Google zgodaj zjutraj izdal tri modele naenkrat: Gemini 2.0 Pro, Gemini 2.0 Flash in Gemini 2.0 Flash-Lite. Na lestvici velikega modela LMSYS je Gemini ...

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Nekategorizirano

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Avtor:zddeepseeker 8. februar 20258. februar 2025

Poudarki AI Agent preoblikuje uporabniško izkušnjo Jesse Zhang: Kako je agent pravzaprav sestavljen? Naše mnenje je, da bo sčasoma vse bolj podoben agentu, ki temelji na naravnem jeziku, ker se tako usposabljajo veliki jezikovni modeli (LLM). Dolgoročno, če imate super inteligentnega agenta, ki ...

Nekategorizirano

Cathie Wood: DeepSeek samo pospešuje proces zmanjševanja stroškov; ekstremno koncentrirana tržna struktura, primerljiva z veliko depresijo, se bo spremenila

Avtor:zddeepseeker 8. februar 20258. februar 2025

Poudarki Konkurenca z DeepSeek je dobra za ZDA Cathie Wood: Mislim, da kaže, da stroški inovacij dramatično padajo in da se je ta trend že začel. Na primer, pred DeepSeek so stroški usposabljanja umetne inteligence padli za 75% na leto, stroški sklepanja pa celo za 85% na ...

Nekategorizirano

Google je izdal tri nove modele naenkrat: Gemini-2.0-Pro je brezplačen, ima izjemen rezultat in je na prvem mestu ter je primeren za kodiranje in obdelavo zapletenih pozivov!

Avtor:zddeepseeker 8. februar 20258. februar 2025

Zgodba o Gemini 2.0 se pospešuje. Različica Flash Thinking Experimental decembra je razvijalcem prinesla delujoč model z nizko zakasnitvijo in visoko zmogljivostjo. V začetku tega leta je bil 2.0 Flash Thinking Experimental posodobljen v Google AI Studio za nadaljnje izboljšanje zmogljivosti s kombinacijo hitrosti Flasha in izboljšanih zmožnosti sklepanja. Prejšnji teden,…

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

Nekategorizirano

DeepSeek TOP17 najboljših alternativ: celovita analiza (2025)

Avtor:deepseeker 6. februar 20256. februar 2025

Uvod V hitro razvijajočem se okolju umetne inteligence se je DeepSeek izkazal kot močan jezikovni model. Ta celovita analiza raziskuje 17 najboljših alternativ za DeepSeek, preučuje njihove edinstvene lastnosti, zmogljivosti in primere uporabe. Naše raziskave se osredotočajo na mednarodne in kitajske platforme, ki ponujajo integracijo DeepSeek ali podobne zmogljivosti. Analiza najboljših alternativ 1….

Nekategorizirano

Ali Qwen2.5-Max prehitel DeepSeek-V3! Netizen: Kitajska umetna inteligenca hitro zmanjšuje vrzel

Avtor:zddeepseeker 5. februar 20255. februar 2025

Ravno zdaj je bil na seznam Big Model Arena družbe Ali dodan še en domači model, Qwen2.5-Max, ki je presegel DeepSeek-V3 in se uvrstil na sedmo mesto v skupni razvrstitvi s skupnim rezultatom 1332. Z enim zamahom je presegel tudi modela, kot sta Claude 3.5 Sonnet in Llama 3.1 405B. Predvsem se odlikuje v programiranju…