Oor die afgelope paar dae is Deepseek-R1 0528 amptelik oopbron beskikbaar gestel. Op LiveCodeBench is die werkverrigting daarvan amper gelykstaande aan OpenAI se o3 (hoog); in Aider se veeltalige maatstaftoets staan dit sy eie teen Claude Opus. Toe dit op die amptelike webwerf bekendgestel is, het ons vinnig die voorkantvermoëns daarvan getoets en gevind dat dit buitengewoon is...
Die DeepSeek R1-model het 'n klein weergawe-opgradering ondergaan, met die huidige weergawe DeepSeek-R1-0528. Wanneer jy die DeepSeek-webwerf of -toepassing besoek, aktiveer die "Diep denke"-funksie in die dialoogkoppelvlak om die nuutste weergawe te ervaar. Die DeepSeek-R1-0528-modelgewigte is na HuggingFace opgelaai. Oor die afgelope vier maande het DeepSeek-R1...
Verlede week het DeepSeek aangekondig dat hy volgende week vyf projekte sal oopmaak: Netizens het gesê: "Hierdie keer is OpenAI regtig hier." Netnou het die eerste oopbronprojek gekom, wat verband hou met afleidingversnelling, FlashMLA: Oopbronprojekadres: DeepSeek FlashMLA Dit is al twee uur lank oopbron, en Github het reeds 2.7k+ sterre: Die ...
FlashMLA het vinnig aandag gekry in die wêreld van kunsmatige intelligensie, veral op die gebied van groot taalmodelle (LLM's). Hierdie innoverende instrument, ontwikkel deur DeepSeek, dien as 'n geoptimaliseerde dekoderingskern wat ontwerp is vir Hopper GPU's - hoëprestasieskyfies wat algemeen in AI-berekeninge gebruik word. FlashMLA fokus op die doeltreffende verwerking van reekse van veranderlike lengte, wat dit besonder goed geskik maak ...