Tijekom proteklih nekoliko dana, Deepseek-R1 0528 je službeno postao otvorenog koda. Na LiveCodeBenchu, njegove performanse su gotovo na razini OpenAI-jevog o3 (visokog); u Aiderovom višejezičnom benchmark testu, nosi se s Claude Opusom. Kada je lansiran na službenoj web stranici, brzo smo testirali njegove mogućnosti na front-endu i otkrili da su iznimno…
Model DeepSeek R1 je prošao kroz manju nadogradnju verzije, a trenutna verzija je DeepSeek-R1-0528. Kada uđete na web stranicu ili aplikaciju DeepSeek, omogućite značajku "Duboko razmišljanje" u dijaloškom sučelju kako biste iskusili najnoviju verziju. Težine modela DeepSeek-R1-0528 prenesene su na HuggingFace. Tijekom protekla četiri mjeseca, DeepSeek-R1 je prošao kroz…
Prošlog je tjedna DeepSeek najavio da će sljedeći tjedan otvoriti pet projekata: Netizeni su rekli: "Ovaj put, OpenAI je stvarno ovdje." Upravo se pojavio prvi projekt otvorenog koda, povezan s ubrzanjem zaključivanja, FlashMLA: Adresa projekta otvorenog koda: DeepSeek FlashMLA Otvoreni je kod dva sata, a Github već ima 2,7k+ zvjezdica: The…
FlashMLA je brzo privukao pozornost u svijetu umjetne inteligencije, posebno u području velikih jezičnih modela (LLM). Ovaj inovativni alat, koji je razvio DeepSeek, služi kao optimizirana jezgra za dekodiranje dizajnirana za Hopper GPU-ove—čipove visokih performansi koji se obično koriste u AI računanjima. FlashMLA se fokusira na učinkovitu obradu sekvenci promjenjive duljine, što ga čini posebno pogodnim za...