zddeepseeker - Deepseek R1 - Sida 2 av 3

Okategoriserade

DeepSeek-R1-teknologi avslöjad: kärnprinciperna i papperet bryts ner och nyckeln till banbrytande modellprestanda avslöjas

Avzddeepseeker 9 februari 20259 februari 2025

Idag kommer vi att dela DeepSeek R1, Titel: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM via reinforcement learning. Detta dokument introducerar DeepSeek:s första generation av resonemangsmodeller, DeepSeek-R1-Zero och DeepSeek-R1. DeepSeek-R1-Zero-modellen tränades genom storskalig förstärkningsinlärning (RL) utan övervakad finjustering (SFT) som ett första steg,...

Okategoriserade

DeepSeek R1 papperstolkning & viktiga tekniska punkter

Avzddeepseeker 9 februari 20259 februari 2025

1 Bakgrund Under vårfesten väckte DeepSeek R1 återigen stor uppmärksamhet, och även tolkningsartikeln DeepSeek V3 vi tidigare skrev återsändes och diskuterades mycket. Även om det har gjorts många analyser och reproduktioner av DeepSeek R1, har vi här beslutat att sammanställa några motsvarande läsanteckningar. Vi kommer att använda tre...

Googles lågkostnadsmodell, Gemini 2.0-serien, attackerar: kampen om kostnadseffektivitet i stora modeller intensifieras

Okategoriserade

Googles lågkostnadsmodell, Gemini 2.0-serien, attackerar: kampen om kostnadseffektivitet i stora modeller intensifieras

Avzddeepseeker 8 februari 20258 februari 2025

Den höga kostnaden för att använda stora AI-modeller är en viktig anledning till att många AI-applikationer ännu inte har implementerats och marknadsförts. Att välja extrem prestanda innebär enorma kostnader för datorkraft, vilket leder till höga användningskostnader som vanliga användare inte kan acceptera. Konkurrensen om stora AI-modeller är som ett krig utan rök. Efter…

Gemini 2.0 dominerar listorna, medan DeepSeek V3 gråter i priset, och en ny kostnadseffektiv mästare är född!

Okategoriserade

Gemini 2.0 dominerar listorna, medan DeepSeek V3 gråter i priset, och en ny kostnadseffektiv mästare är född!

Avzddeepseeker 8 februari 20258 februari 2025

Google Gemini 2.0-familjen är äntligen komplett! Den dominerar listorna så fort den släpps. Mitt i jakten på och blockaderna av Deepseek, Qwen och o3 släppte Google tre modeller på en gång tidigt i morse: Gemini 2.0 Pro, Gemini 2.0 Flash och Gemini 2.0 Flash-Lite. På den stora modellen LMSYS-rankingen, Gemini...

a16z dialog med 27-årig VD: AI Agent har en enorm hävstångseffekt, och långsiktig prissättning kommer att vara kopplad till arbetskostnader

Okategoriserade

a16z dialog med 27-årig VD: AI Agent har en enorm hävstångseffekt, och långsiktig prissättning kommer att vara kopplad till arbetskostnader

Avzddeepseeker 8 februari 20258 februari 2025

Höjdpunkter AI Agent omformar kundupplevelsen Jesse Zhang: Hur är en agent egentligen konstruerad? Vår uppfattning är att det med tiden kommer att bli mer och mer som en naturlig språkbaserad Agent eftersom det är så de stora språkmodellerna (LLM) tränas. På lång sikt, om du har en superintelligent agent som...

Okategoriserade

Cathie Wood: DeepSeek påskyndar bara kostnadsreduktionsprocessen; den extremt koncentrerade marknadsstrukturen jämförbar med den stora depressionen kommer att förändras

Avzddeepseeker 8 februari 20258 februari 2025

Höjdpunkter Konkurrens med DeepSeek är bra för USA:s Cathie Wood: Jag tror att det visar att kostnaden för innovation sjunker dramatiskt och att denna trend redan har börjat. Till exempel, före DeepSeek sjönk kostnaden för att träna artificiell intelligens med 75% per år, och kostnaden för slutledning sjönk till och med med 85% till...

Okategoriserade

Google har släppt tre nya modeller samtidigt: Gemini-2.0-Pro är gratis, har enastående poäng och rankas först och är lämplig för kodning och bearbetning av komplexa uppmaningar!

Avzddeepseeker 8 februari 20258 februari 2025

Historien om Gemini 2.0 accelererar. Flash Thinking Experimental-versionen i december gav utvecklarna en fungerande modell med låg latens och hög prestanda. Tidigare i år uppdaterades 2.0 Flash Thinking Experimental i Google AI Studio för att ytterligare förbättra prestandan genom att kombinera hastigheten på Flash med förbättrade slutledningsmöjligheter. Förra veckan,…

Okategoriserade

Ali Qwen2.5-Max kör om DeepSeek-V3! Netizen: Kinas AI minskar snabbt gapet

Avzddeepseeker 5 februari 20255 februari 2025

Just nu lades en annan inhemsk modell till på Big Model Arena-listan från Ali, Qwen2.5-Max, som överträffade DeepSeek-V3 och rankades som sjua i den totala rankingen med en totalpoäng på 1332. Den överträffade även modeller som Claude 3.5 Sonnet och Llama 3.1 405B i ett fall. I synnerhet utmärker det sig i programmering...

Breaking news! DeepSeek-forskare avslöjar online: R1-träning tog bara två till tre veckor, och en kraftfull utveckling av R1 noll observerades under den kinesiska nyårshelgen

Okategoriserade

Breaking news! DeepSeek-forskare avslöjar online: R1-träning tog bara två till tre veckor, och en kraftfull utveckling av R1 noll observerades under den kinesiska nyårshelgen

Avzddeepseeker 4 februari 20254 februari 2025

Breaking news! DeepSeek-forskare avslöjar online: R1-träning tog bara två till tre veckor, och en kraftfull utveckling av R1 noll observerades under den kinesiska nyårshelgen. Nyss märkte vi att DeepSeek-forskaren Daya Guo svarade på nätanvändares frågor om DeepSeek R1 och företagets planer framåt. Vi kan bara säga...

DeepSeek R1 kom först i testet för kreativt skrivande, och o3 mini var till och med sämre än o1 mini!

Okategoriserade

DeepSeek R1 kom först i testet för kreativt skrivande, och o3 mini var till och med sämre än o1 mini!

Avzddeepseeker 3 februari 20253 februari 2025

DeepSeek R1 vann mästerskapet i benchmarktestet för kreativt skrivande av noveller och överträffade därmed den tidigare dominanten Claude 3.5 Sonnet! Benchmarktest Benchmarktestet som utformades av forskaren Lech Mazur är inte en vanlig skrivtävling. Varje AI-modell skulle skriva 500 noveller, och varje novell skulle på ett smart sätt innehålla...