Tinklaraštis

Keturių geriausių modelių akistata! Apžvalga parodo, koks galingas yra „Deepseek R1“birželio 1 d., 2025 m.
Per pastarąsias kelias dienas „Deepseek-R1 0528“ oficialiai tapo atvirojo kodo kodu. „LiveCodeBench“ teste jo našumas beveik prilygsta „OpenAI“ o3 (aukštas); „Aider“ daugiakalbiame lyginamajame teste jis nenusileidžia „Claude Opus“. Kai jis buvo paleistas oficialioje svetainėje, greitai išbandėme jo sąsajos galimybes ir nustatėme, kad jos išskirtinai...
DeepSeek-R1-0528 Atnaujinimas: Gilesnis mąstymas, stipresnis samprotavimasgegužės 29 d., 2025 m.
DeepSeek R1 modelis buvo šiek tiek atnaujintas ir dabartinė versija yra DeepSeek-R1-0528. Įėję į DeepSeek tinklalapį arba programėlę, dialogo sąsajoje įjunkite funkciją „Gilus mąstymas“, kad galėtumėte išbandyti naujausią versiją. DeepSeek-R1-0528 modelio svoriai buvo įkelti į „HuggingFace“. Per pastaruosius keturis mėnesius DeepSeek-R1 buvo atnaujintas…
DeepSeek išleido savo šaltinio kodą, išsamų FlashMLA paaiškinimą2025 m. vasario 24 d
Praėjusią savaitę DeepSeek paskelbė, kad kitą savaitę atidarys penkis projektus: internautai sakė: „Šį kartą OpenAI tikrai čia“. Ką tik pasirodė pirmasis atvirojo kodo projektas, susijęs su išvadų pagreitinimu, FlashMLA: Atvirojo kodo projekto adresas: DeepSeek FlashMLA Jis buvo atviro kodo dvi valandas, o „Github“ jau turi 2,7 tūkst.+ žvaigždučių:…
Kas yra FlashMLA? Išsamus vadovas apie jo poveikį AI dekodavimo branduoliams2025 m. vasario 24 d
FlashMLA greitai sulaukė dėmesio dirbtinio intelekto pasaulyje, ypač didelių kalbų modelių (LLM) srityje. Šis naujoviškas įrankis, sukurtas DeepSeek, yra optimizuotas dekodavimo branduolys, sukurtas Hopper GPU – didelio našumo lustams, dažniausiai naudojamiems AI skaičiavimuose. „FlashMLA“ daugiausia dėmesio skiria efektyviam kintamo ilgio sekų apdorojimui, todėl ji ypač tinka…

Sukurkite nemokamą paskyrą šiandien!

Išbandykite nemokamai