Az elmúlt napokban a Deepseek-R1 0528 hivatalosan is nyílt forráskódúvá vált. A LiveCodeBench-en a teljesítménye majdnem megegyezik az OpenAI o3-as (magas) szintjével; az Aider többnyelvű benchmark tesztjében Claude Opusszal vetekszik. Amikor a hivatalos weboldalon megjelent, gyorsan teszteltük a front-end képességeit, és kivételesen…
Az DeepSeek R1 modell kisebb verziófrissítésen esett át, a jelenlegi verzió az DeepSeek-R1-0528. Amikor belép az DeepSeek weboldalára vagy alkalmazásába, engedélyezze a „Mély gondolkodás” funkciót a párbeszédpanelen a legújabb verzió megismeréséhez. Az DeepSeek-R1-0528 modell súlyait feltöltöttük a HuggingFace-re. Az elmúlt négy hónapban az DeepSeek-R1…
Múlt héten az DeepSeek bejelentette, hogy a jövő héten öt projektet nyit meg a forráskóddal: A Netizens azt mondta: „Ezúttal valóban itt van az OpenAI.” Most érkezett meg az első nyílt forráskódú projekt, a következtetések gyorsításával kapcsolatban, FlashMLA: Nyílt forráskódú projekt címe: DeepSeek FlashMLA Két órája nyílt forráskódú, és a Githubnak már több mint 2,7 ezer csillaga van: A…
A FlashMLA gyorsan felkeltette a figyelmet a mesterséges intelligencia világában, különösen a nagy nyelvi modellek (LLM) területén. Ez az innovatív eszköz, amelyet az DeepSeek fejlesztett ki, optimalizált dekódoló kernelként szolgál, amelyet Hopper GPU-khoz – az AI-számításoknál általánosan használt nagy teljesítményű chipekhez – terveztek. A FlashMLA a változó hosszúságú sorozatok hatékony feldolgozására összpontosít, így különösen jól használható…