Blog

  • A négy legjobb modell leszámolása! Egy teszt bemutatja, milyen erős a Deepseek R1
    Az elmúlt napokban a Deepseek-R1 0528 hivatalosan is nyílt forráskódúvá vált. A LiveCodeBench-en a teljesítménye majdnem megegyezik az OpenAI o3-as (magas) szintjével; az Aider többnyelvű benchmark tesztjében Claude Opusszal vetekszik. Amikor a hivatalos weboldalon megjelent, gyorsan teszteltük a front-end képességeit, és kivételesen…
  • DeepSeek-R1-0528 Frissítés: Mélyebb gondolkodás, erősebb érvelés
    Az DeepSeek R1 modell kisebb verziófrissítésen esett át, a jelenlegi verzió az DeepSeek-R1-0528. Amikor belép az DeepSeek weboldalára vagy alkalmazásába, engedélyezze a „Mély gondolkodás” funkciót a párbeszédpanelen a legújabb verzió megismeréséhez. Az DeepSeek-R1-0528 modell súlyait feltöltöttük a HuggingFace-re. Az elmúlt négy hónapban az DeepSeek-R1…
  • Az DeepSeek kiadta forráskódját, a FlashMLA részletes magyarázatát
    Múlt héten az DeepSeek bejelentette, hogy a jövő héten öt projektet nyit meg a forráskóddal: A Netizens azt mondta: „Ezúttal valóban itt van az OpenAI.” Most érkezett meg az első nyílt forráskódú projekt, a következtetések gyorsításával kapcsolatban, FlashMLA: Nyílt forráskódú projekt címe: DeepSeek FlashMLA Két órája nyílt forráskódú, és a Githubnak már több mint 2,7 ezer csillaga van: A…
  • Mi az a FlashMLA? Átfogó útmutató az AI dekódoló kernelekre gyakorolt hatásáról
    A FlashMLA gyorsan felkeltette a figyelmet a mesterséges intelligencia világában, különösen a nagy nyelvi modellek (LLM) területén. Ez az innovatív eszköz, amelyet az DeepSeek fejlesztett ki, optimalizált dekódoló kernelként szolgál, amelyet Hopper GPU-khoz – az AI-számításoknál általánosan használt nagy teljesítményű chipekhez – terveztek. A FlashMLA a változó hosszúságú sorozatok hatékony feldolgozására összpontosít, így különösen jól használható…

Hozzon létre ingyenes fiókot még ma!