Under de senaste dagarna har Deepseek-R1 0528 officiellt blivit öppen källkod. På LiveCodeBench är dess prestanda nästan i nivå med OpenAI:s o3 (hög); i Aiders flerspråkiga benchmarktest står den sig mot Claude Opus. När den lanserades på den officiella webbplatsen testade vi snabbt dess frontend-funktioner och fann att de var exceptionellt ...
DeepSeek R1-modellen har genomgått en mindre versionsuppgradering, där den nuvarande versionen är DeepSeek-R1-0528. När du öppnar DeepSeek-webbsidan eller appen, aktivera funktionen "Djuptänkande" i dialoggränssnittet för att uppleva den senaste versionen. DeepSeek-R1-0528-modellens vikter har laddats upp till HuggingFace. Under de senaste fyra månaderna har DeepSeek-R1 genomgått...
Förra veckan meddelade DeepSeek att de skulle öppna källkod för fem projekt nästa vecka: Netizens sa: "Den här gången är OpenAI verkligen här." Just nu kom det första open source-projektet, relaterat till inferensacceleration, FlashMLA: Open source-projektadress: DeepSeek FlashMLA Det har varit öppen källkod i två timmar, och Github har redan 2,7k+ stjärnor: The...
FlashMLA har snabbt fått uppmärksamhet i världen av artificiell intelligens, särskilt inom området för stora språkmodeller (LLM). Detta innovativa verktyg, utvecklat av DeepSeek, fungerar som en optimerad avkodningskärna designad för Hopper GPU:er – högpresterande chips som vanligtvis används i AI-beräkningar. FlashMLA fokuserar på effektiv bearbetning av sekvenser med variabel längd, vilket gör den särskilt väl lämpad...