În ultimele zile, Deepseek-R1 0528 a fost oficial open-source. Pe LiveCodeBench, performanța sa este aproape la egalitate cu o3 (high) al OpenAI; în testul de referință multilingv al Aider, se compară cu Claude Opus. Când a fost lansat pe site-ul oficial, am testat rapid capacitățile sale front-end și le-am constatat a fi excepțional de...
Modelul DeepSeek R1 a suferit o actualizare minoră, versiunea actuală fiind DeepSeek-R1-0528. Când accesați pagina web sau aplicația DeepSeek, activați funcția „Deep Thinking” din interfața de dialog pentru a experimenta cea mai recentă versiune. Ponderile modelului DeepSeek-R1-0528 au fost încărcate pe HuggingFace. În ultimele patru luni, DeepSeek-R1 a suferit...
Săptămâna trecută, DeepSeek a anunțat că va deschide cinci proiecte săptămâna viitoare: Netizens a spus: „De data aceasta, OpenAI este cu adevărat aici”. Chiar acum, a venit primul proiect open source, legat de accelerarea inferenței, FlashMLA: Adresa proiectului open source: DeepSeek FlashMLA A fost open source de două ore, iar Github are deja 2.7k+ stele: The...
FlashMLA a câștigat rapid atenția în lumea inteligenței artificiale, în special în domeniul modelelor de limbaj mari (LLM). Acest instrument inovator, dezvoltat de DeepSeek, servește ca un nucleu de decodare optimizat conceput pentru GPU-uri Hopper - cipuri de înaltă performanță utilizate în mod obișnuit în calculele AI. FlashMLA se concentrează pe procesarea eficientă a secvențelor cu lungime variabilă, făcându-l deosebit de potrivit...