Tinklaraštis

  • Keturių geriausių modelių akistata! Apžvalga parodo, koks galingas yra „Deepseek R1“
    Per pastarąsias kelias dienas „Deepseek-R1 0528“ oficialiai tapo atvirojo kodo kodu. „LiveCodeBench“ teste jo našumas beveik prilygsta „OpenAI“ o3 (aukštas); „Aider“ daugiakalbiame lyginamajame teste jis nenusileidžia „Claude Opus“. Kai jis buvo paleistas oficialioje svetainėje, greitai išbandėme jo sąsajos galimybes ir nustatėme, kad jos išskirtinai...
  • DeepSeek-R1-0528 Atnaujinimas: Gilesnis mąstymas, stipresnis samprotavimas
    DeepSeek R1 modelis buvo šiek tiek atnaujintas ir dabartinė versija yra DeepSeek-R1-0528. Įėję į DeepSeek tinklalapį arba programėlę, dialogo sąsajoje įjunkite funkciją „Gilus mąstymas“, kad galėtumėte išbandyti naujausią versiją. DeepSeek-R1-0528 modelio svoriai buvo įkelti į „HuggingFace“. Per pastaruosius keturis mėnesius DeepSeek-R1 buvo atnaujintas…
  • DeepSeek išleido savo šaltinio kodą, išsamų FlashMLA paaiškinimą
    Praėjusią savaitę DeepSeek paskelbė, kad kitą savaitę atidarys penkis projektus: internautai sakė: „Šį kartą OpenAI tikrai čia“. Ką tik pasirodė pirmasis atvirojo kodo projektas, susijęs su išvadų pagreitinimu, FlashMLA: Atvirojo kodo projekto adresas: DeepSeek FlashMLA Jis buvo atviro kodo dvi valandas, o „Github“ jau turi 2,7 tūkst.+ žvaigždučių:…
  • Kas yra FlashMLA? Išsamus vadovas apie jo poveikį AI dekodavimo branduoliams
    FlashMLA greitai sulaukė dėmesio dirbtinio intelekto pasaulyje, ypač didelių kalbų modelių (LLM) srityje. Šis naujoviškas įrankis, sukurtas DeepSeek, yra optimizuotas dekodavimo branduolys, sukurtas Hopper GPU – didelio našumo lustams, dažniausiai naudojamiems AI skaičiavimuose. „FlashMLA“ daugiausia dėmesio skiria efektyviam kintamo ilgio sekų apdorojimui, todėl ji ypač tinka…

Sukurkite nemokamą paskyrą šiandien!