I løbet af de seneste par dage er Deepseek-R1 0528 officielt blevet open source. På LiveCodeBench er dens ydeevne næsten på niveau med OpenAIs o3 (høj); i Aiders flersprogede benchmarktest kan den måle sig med Claude Opus. Da den blev lanceret på den officielle hjemmeside, testede vi hurtigt dens frontend-funktioner og fandt dem exceptionelt ...
DeepSeek R1-modellen har gennemgået en mindre versionsopgradering, hvor den nuværende version er DeepSeek-R1-0528. Når du åbner DeepSeek-websiden eller -appen, skal du aktivere funktionen "Deep Thinking" i dialoggrænsefladen for at opleve den nyeste version. DeepSeek-R1-0528-modelvægtene er blevet uploadet til HuggingFace. I løbet af de sidste fire måneder har DeepSeek-R1 gennemgået...
I sidste uge annoncerede DeepSeek, at det ville open source fem projekter i næste uge: Netizens sagde: "Denne gang er OpenAI virkelig her." Lige nu kom det første open source-projekt, relateret til inferensacceleration, FlashMLA: Open source-projektadresse: DeepSeek FlashMLA Det har været open source i to timer, og Github har allerede 2,7k+ stjerner: The...
FlashMLA har hurtigt fået opmærksomhed i verden af kunstig intelligens, især inden for store sprogmodeller (LLM'er). Dette innovative værktøj, udviklet af DeepSeek, fungerer som en optimeret afkodningskerne designet til Hopper GPU'er - højtydende chips, der almindeligvis bruges i AI-beregninger. FlashMLA fokuserer på effektiv behandling af sekvenser med variabel længde, hvilket gør det særligt velegnet...