Määratlemata - Deepseek R1

DeepSeek 1 saladus | DeepSeekMath ja GRPO üksikasjad

Mittekategoriseeritud

DeepSeek 1 saladus | DeepSeekMath ja GRPO üksikasjad

Autorzddeepseeker 9. veebruar 20259. veebruar 2025

Täna tahaksin jagada DeepSeek artiklit pealkirjaga DeepSeekMath: Matemaatilise arutluse piiride lükkamine avatud keelemudelites. Selles artiklis tutvustatakse versiooni DeepSeekMath 7B, mis on eelkoolitatud versioonil DeepSeek-Coder-Base-v1.5 7B, mis põhineb 120B matemaatikaga seotud žetoonide, loomuliku keele ja koodi andmetel. Mudel saavutas konkurentsitasemel hämmastava skoori 51,7%…

Mittekategoriseeritud

Tehnoloogia DeepSeek-R1 paljastas: paberi põhiprintsiibid on lahti võetud ja mudeli läbimurdelise jõudluse võti paljastatakse

Autorzddeepseeker 9. veebruar 20259. veebruar 2025

Täna jagame DeepSeek R1, pealkiri: DeepSeek-R1: LLM-ide arutlusvõime stimuleerimine tugevdava õppe kaudu: LLM-i arutlusvõime ergutamine tugevdava õppe kaudu. See artikkel tutvustab DeepSeek esimese põlvkonna arutlusmudeleid DeepSeek-R1-Zero ja DeepSeek-R1. Mudelit DeepSeek-R1-Zero koolitati esimese sammuna suuremahulise tugevdusõppe (RL) abil ilma juhendatud peenhäälestuseta (SFT),…

Mittekategoriseeritud

DeepSeek R1 paberi tõlgendamine ja peamised tehnilised punktid

Autorzddeepseeker 9. veebruar 20259. veebruar 2025

1 Taust Kevadfestivali ajal äratas DeepSeek R1 taas laialdast tähelepanu ning isegi meie varem kirjutatud DeepSeek V3 tõlgendusartikkel edastati uuesti ja seda arutati palju. Kuigi DeepSeek R1 analüüse ja reproduktsioone on tehtud palju, otsustasime siinkohal koostada mõned vastavad lugemismärkmed. Kasutame kolme…

Google'i odav mudel Gemini 2.0 seeria ründab: võitlus suurte mudelite kuluefektiivsuse pärast teravneb

Mittekategoriseeritud

Google'i odav mudel Gemini 2.0 seeria ründab: võitlus suurte mudelite kuluefektiivsuse pärast teravneb

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Suurte tehisintellekti mudelite kasutamise kõrge hind on peamine põhjus, miks paljusid tehisintellekti rakendusi pole veel juurutatud ega reklaamitud. Ekstreemse jõudluse valimine tähendab tohutuid arvutusvõimsuse kulusid, mis toob kaasa kõrged kasutuskulud, millega tavakasutajad ei nõustu. Võistlus suurte tehisintellekti mudelite pärast on nagu sõda ilma suitsuta. Pärast…

Gemini 2.0 domineerib edetabelites, samas kui DeepSeek V3 nutab oma hinda ja uus kuluefektiivne meister on sündinud!

Mittekategoriseeritud

Gemini 2.0 domineerib edetabelites, samas kui DeepSeek V3 nutab oma hinda ja uus kuluefektiivne meister on sündinud!

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Google Gemini 2.0 perekond on lõpuks valmis! See domineerib edetabelites kohe pärast ilmumist. Keset Deepseeki, Qweni ja o3 jälitamist ja blokaade avaldas Google täna varahommikul korraga kolm mudelit: Gemini 2.0 Pro, Gemini 2.0 Flash ja Gemini 2.0 Flash-Lite. Suure mudeli LMSYS edetabelis on Gemini…

a16z dialoog 27-aastase tegevjuhiga: AI agendil on tohutu võimendav mõju ja pikaajaline hinnakujundus on seotud tööjõukuludega

Mittekategoriseeritud

a16z dialoog 27-aastase tegevjuhiga: AI agendil on tohutu võimendav mõju ja pikaajaline hinnakujundus on seotud tööjõukuludega

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Esiletõstetud AI Agent kujundab kliendikogemuse ümber Jesse Zhang: Kuidas agent tegelikult koostatakse? Meie seisukoht on, et aja jooksul muutub see üha enam loomuliku keelepõhise agendi sarnaseks, sest nii koolitatakse suuri keelemudeleid (LLM). Pikas perspektiivis, kui teil on ülitark agent, kes…

Mittekategoriseeritud

Cathie Wood: DeepSeek lihtsalt kiirendab kulude vähendamise protsessi; Suure Depressiooniga võrreldav äärmuslikult kontsentreeritud turustruktuur muutub

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Tähtsündmused Konkurents DeepSeek-ga on USA Cathie Woodile kasulik: minu arvates näitab see, et innovatsiooni hind langeb järsult ja see trend on juba alanud. Näiteks enne DeepSeek-d langesid tehisintellekti treenimise kulud 75% võrra aastas ja järelduste tegemise hind isegi 85% võrra…

Mittekategoriseeritud

Google on välja andnud kolm uut mudelit korraga: Gemini-2.0-Pro on tasuta, suurepärase punktisummaga ja esikohal ning sobib keerukate viipade kodeerimiseks ja töötlemiseks!

Autorzddeepseeker veebruar 8, 2025veebruar 8, 2025

Gemini 2.0 lugu kiireneb. Detsembris ilmunud Flash Thinking Experimental versioon tõi arendajatele madala latentsusajaga ja suure jõudlusega töötava mudeli. Selle aasta alguses värskendati Google AI Studios versiooni 2.0 Flash Thinking Experimental, et veelgi parandada jõudlust, ühendades Flashi kiiruse täiustatud järeldamisvõimalustega. Eelmisel nädalal,…

DeepSeek TOP17 parimat alternatiivi: põhjalik analüüs (2025)

Mittekategoriseeritud

DeepSeek TOP17 parimat alternatiivi: põhjalik analüüs (2025)

Autordeepseeker 6. veebruar 20256. veebruar 2025

Sissejuhatus Tehisintellekti kiiresti areneval maastikul on DeepSeek tõusnud võimsa keelemudelina. See põhjalik analüüs uurib 17 parimat DeepSeek alternatiivi, uurides nende ainulaadseid funktsioone, võimalusi ja kasutusjuhtumeid. Meie uurimistöö keskendub nii rahvusvahelistele kui ka Hiina platvormidele, mis pakuvad DeepSeek integratsiooni või sarnaseid võimalusi. Populaarsete alternatiivide analüüs 1….

Mittekategoriseeritud

Ali Qwen2.5-Max edestab DeepSeek-V3! Netizen: Hiina tehisintellekt kahandab vahet kiiresti

Autorzddeepseeker 5. veebruar 20255. veebruar 2025

Just nüüd lisandus Ali Big Model Arena nimekirja veel üks kodumaine mudel Qwen2.5-Max, mis ületas DeepSeek-V3 ja saavutas üldarvestuses seitsmenda koha koguskooriga 1332. Samuti edestas see mudeleid nagu Claude 3.5 Sonnet ja Llama 3.1 405B ühes felllswoop. Eelkõige paistab see silma programmeerimises…