Per pastarąsias kelias dienas „Deepseek-R1 0528“ oficialiai tapo atvirojo kodo kodu. „LiveCodeBench“ teste jo našumas beveik prilygsta „OpenAI“ o3 (aukštas); „Aider“ daugiakalbiame lyginamajame teste jis nenusileidžia „Claude Opus“. Kai jis buvo paleistas oficialioje svetainėje, greitai išbandėme jo sąsajos galimybes ir nustatėme, kad jos išskirtinai...
DeepSeek R1 modelis buvo šiek tiek atnaujintas ir dabartinė versija yra DeepSeek-R1-0528. Įėję į DeepSeek tinklalapį arba programėlę, dialogo sąsajoje įjunkite funkciją „Gilus mąstymas“, kad galėtumėte išbandyti naujausią versiją. DeepSeek-R1-0528 modelio svoriai buvo įkelti į „HuggingFace“. Per pastaruosius keturis mėnesius DeepSeek-R1 buvo atnaujintas…
Praėjusią savaitę DeepSeek paskelbė, kad kitą savaitę atidarys penkis projektus: internautai sakė: „Šį kartą OpenAI tikrai čia“. Ką tik pasirodė pirmasis atvirojo kodo projektas, susijęs su išvadų pagreitinimu, FlashMLA: Atvirojo kodo projekto adresas: DeepSeek FlashMLA Jis buvo atviro kodo dvi valandas, o „Github“ jau turi 2,7 tūkst.+ žvaigždučių:…
FlashMLA greitai sulaukė dėmesio dirbtinio intelekto pasaulyje, ypač didelių kalbų modelių (LLM) srityje. Šis naujoviškas įrankis, sukurtas DeepSeek, yra optimizuotas dekodavimo branduolys, sukurtas Hopper GPU – didelio našumo lustams, dažniausiai naudojamiems AI skaičiavimuose. „FlashMLA“ daugiausia dėmesio skiria efektyviam kintamo ilgio sekų apdorojimui, todėl ji ypač tinka…