zddeepseeker - Deepseek R1 - Stran 2 od 3

Nekategorizirano

Razkrita tehnologija DeepSeek-R1: temeljna načela papirja so razčlenjena in razkrit je ključ do prebojne zmogljivosti modela

Avtor:zddeepseeker 9. februar 20259. februar 2025

Danes bomo delili DeepSeek R1, naslov: DeepSeek-R1: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja s krepitvijo: Spodbujanje zmožnosti sklepanja pri LLM s pomočjo učenja z okrepitvijo. Ta članek predstavlja prvo generacijo modelov razmišljanja DeepSeek, DeepSeek-R1-Zero in DeepSeek-R1. Model DeepSeek-R1-Zero je bil kot začetni korak usposobljen z obsežnim okrepitvenim učenjem (RL) brez nadzorovane natančne nastavitve (SFT), ...

Nekategorizirano

Razlaga papirja DeepSeek R1 in ključne tehnične točke

Avtor:zddeepseeker 9. februar 20259. februar 2025

1 Ozadje Med pomladnim festivalom je DeepSeek R1 znova pritegnil široko pozornost in celo članek o interpretaciji DeepSeek V3, ki smo ga napisali prej, je bil prav tako ponovno posredovan in o njem veliko razpravljali. Čeprav je bilo veliko analiz in reprodukcij DeepSeek R1, smo se tukaj odločili zbrati nekaj ustreznih opomb pri branju. Uporabili bomo tri…

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Nekategorizirano

Googlov nizkocenovni model, serija Gemini 2.0, napada: bitka za stroškovno učinkovitost pri velikih modelih se zaostruje

Avtor:zddeepseeker 8. februar 20258. februar 2025

Visoki stroški uporabe velikih modelov umetne inteligence so glavni razlog, zakaj številne aplikacije umetne inteligence še niso bile implementirane in promovirane. Izbira ekstremne zmogljivosti pomeni velike stroške računalniške moči, kar vodi do visokih stroškov uporabe, ki jih navadni uporabniki ne morejo sprejeti. Tekmovanje za velike modele AI je kot vojna brez dima. Po…

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Nekategorizirano

Gemini 2.0 dominira na lestvicah, medtem ko DeepSeek V3 joka zaradi svoje cene in nov stroškovno učinkovit prvak je rojen!

Avtor:zddeepseeker 8. februar 20258. februar 2025

Družina Google Gemini 2.0 je končno dokončana! Na lestvicah prevladuje takoj, ko je izdan. Med preganjanjem in blokadami Deepseek, Qwen in o3 je Google zgodaj zjutraj izdal tri modele naenkrat: Gemini 2.0 Pro, Gemini 2.0 Flash in Gemini 2.0 Flash-Lite. Na lestvici velikega modela LMSYS je Gemini ...

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Nekategorizirano

a16z dialog s 27-letnim izvršnim direktorjem: AI Agent ima ogromen učinek finančnega vzvoda, dolgoročne cene pa bodo povezane s stroški dela

Avtor:zddeepseeker 8. februar 20258. februar 2025

Poudarki AI Agent preoblikuje uporabniško izkušnjo Jesse Zhang: Kako je agent pravzaprav sestavljen? Naše mnenje je, da bo sčasoma vse bolj podoben agentu, ki temelji na naravnem jeziku, ker se tako usposabljajo veliki jezikovni modeli (LLM). Dolgoročno, če imate super inteligentnega agenta, ki ...

Nekategorizirano

Cathie Wood: DeepSeek samo pospešuje proces zmanjševanja stroškov; ekstremno koncentrirana tržna struktura, primerljiva z veliko depresijo, se bo spremenila

Avtor:zddeepseeker 8. februar 20258. februar 2025

Poudarki Konkurenca z DeepSeek je dobra za ZDA Cathie Wood: Mislim, da kaže, da stroški inovacij dramatično padajo in da se je ta trend že začel. Na primer, pred DeepSeek so stroški usposabljanja umetne inteligence padli za 75% na leto, stroški sklepanja pa celo za 85% na ...

Nekategorizirano

Google je izdal tri nove modele naenkrat: Gemini-2.0-Pro je brezplačen, ima izjemen rezultat in je na prvem mestu ter je primeren za kodiranje in obdelavo zapletenih pozivov!

Avtor:zddeepseeker 8. februar 20258. februar 2025

Zgodba o Gemini 2.0 se pospešuje. Različica Flash Thinking Experimental decembra je razvijalcem prinesla delujoč model z nizko zakasnitvijo in visoko zmogljivostjo. V začetku tega leta je bil 2.0 Flash Thinking Experimental posodobljen v Google AI Studio za nadaljnje izboljšanje zmogljivosti s kombinacijo hitrosti Flasha in izboljšanih zmožnosti sklepanja. Prejšnji teden,…

Nekategorizirano

Ali Qwen2.5-Max prehitel DeepSeek-V3! Netizen: Kitajska umetna inteligenca hitro zmanjšuje vrzel

Avtor:zddeepseeker 5. februar 20255. februar 2025

Ravno zdaj je bil na seznam Big Model Arena družbe Ali dodan še en domači model, Qwen2.5-Max, ki je presegel DeepSeek-V3 in se uvrstil na sedmo mesto v skupni razvrstitvi s skupnim rezultatom 1332. Z enim zamahom je presegel tudi modela, kot sta Claude 3.5 Sonnet in Llama 3.1 405B. Predvsem se odlikuje v programiranju…

Udarne novice! Raziskovalec DeepSeek na spletu razkriva: Usposabljanje R1 je trajalo le dva do tri tedne, med kitajskimi novoletnimi prazniki pa so opazili močan razvoj R1 zero.

Nekategorizirano

Udarne novice! Raziskovalec DeepSeek na spletu razkriva: Usposabljanje R1 je trajalo le dva do tri tedne, med kitajskimi novoletnimi prazniki pa so opazili močan razvoj R1 zero.

Avtor:zddeepseeker 4. februar 20254. februar 2025

Udarne novice! Raziskovalec DeepSeek razkrije na spletu: Usposabljanje R1 je trajalo le dva do tri tedne, močan razvoj R1 zero pa je bil opažen med kitajskimi novoletnimi prazniki Pravkar smo opazili, da je raziskovalec DeepSeek Daya Guo odgovoril na vprašanja uporabnikov interneta o DeepSeek R1 in načrtih podjetja naprej. Lahko samo rečemo…

DeepSeek R1 je bil prvi na testu kreativnega pisanja, o3 mini pa je bil še slabši od o1 mini!

Nekategorizirano

DeepSeek R1 je bil prvi na testu kreativnega pisanja, o3 mini pa je bil še slabši od o1 mini!

Avtor:zddeepseeker 3. februar 20253. februar 2025

DeepSeek R1 je osvojil prvenstvo v merilnem preizkusu kreativnega pisanja kratkih zgodb in uspešno presegel prejšnjega dominantnega igralca Claude 3.5 Sonnet! Primerjalni test Primerjalni test, ki ga je zasnoval raziskovalec Lech Mazur, ni vaše povprečno tekmovanje v pisanju. Vsak model AI je moral dokončati 500 kratkih zgodb in vsaka zgodba je morala premeteno vključevati ...