Během posledních několika dnů byl Deepseek-R1 0528 oficiálně open-source. Na LiveCodeBench je jeho výkon téměř srovnatelný s OpenAI o3 (vysoký); v Aiderově vícejazyčném benchmarkovém testu si vede i s Claude Opus. Když byl spuštěn na oficiálních webových stránkách, rychle jsme otestovali jeho front-endové schopnosti a zjistili jsme, že jsou výjimečně…
Model DeepSeek R1 prošel drobnou aktualizací verze, aktuální verze je DeepSeek-R1-0528. Po vstupu na webovou stránku nebo do aplikace DeepSeek povolte v dialogovém okně funkci „Hluboké myšlení“ a vyzkoušejte nejnovější verzi. Závaží modelu DeepSeek-R1-0528 byla nahrána na HuggingFace. Během posledních čtyř měsíců prošel model DeepSeek-R1…
Minulý týden DeepSeek oznámil, že příští týden otevře pět projektů s otevřeným zdrojovým kódem: Netizens řekl: "Tentokrát je OpenAI opravdu tady." Právě teď přišel první open source projekt související s akcelerací inference, FlashMLA: Adresa open source projektu: DeepSeek FlashMLA Již dvě hodiny je open source a Github už má 2,7 000+ hvězdiček: The…
FlashMLA si rychle získal pozornost ve světě umělé inteligence, zejména v oblasti velkých jazykových modelů (LLM). Tento inovativní nástroj vyvinutý společností DeepSeek slouží jako optimalizované dekódovací jádro navržené pro GPU Hopper – vysoce výkonné čipy běžně používané ve výpočtech AI. FlashMLA se zaměřuje na efektivní zpracování sekvencí s proměnnou délkou, díky čemuž je zvláště vhodný…