Negli ultimi giorni, Deepseek-R1 0528 è stato ufficialmente rilasciato come open source. Su LiveCodeBench, le sue prestazioni sono quasi alla pari con quelle di o3 di OpenAI (alte); nel benchmark multilingua di Aider, regge il confronto con Claude Opus. Quando è stato lanciato sul sito web ufficiale, ne abbiamo testato rapidamente le funzionalità front-end e le abbiamo trovate eccezionalmente...
Il modello DeepSeek R1 è stato sottoposto a un aggiornamento minore, la cui versione attuale è DeepSeek-R1-0528. Quando accedete alla pagina web o all'app DeepSeek, attivate la funzione "Deep Thinking" nell'interfaccia di dialogo per provare la versione più recente. I pesi del modello DeepSeek-R1-0528 sono stati caricati su HuggingFace. Negli ultimi quattro mesi, DeepSeek-R1 è stato sottoposto a...
La scorsa settimana, DeepSeek ha annunciato che avrebbe reso open source cinque progetti la prossima settimana: i netizen hanno detto, "Questa volta, OpenAI è davvero qui". Proprio ora, è arrivato il primo progetto open source, relativo all'accelerazione dell'inferenza, FlashMLA: Indirizzo del progetto open source: DeepSeek FlashMLA È open source da due ore e Github ha già 2,7k+ stelle: Il…
FlashMLA ha rapidamente attirato l'attenzione nel mondo dell'intelligenza artificiale, in particolare nel campo dei grandi modelli linguistici (LLM). Questo strumento innovativo, sviluppato da DeepSeek, funge da kernel di decodifica ottimizzato progettato per le GPU Hopper, chip ad alte prestazioni comunemente utilizzati nei calcoli di intelligenza artificiale. FlashMLA si concentra sull'elaborazione efficiente di sequenze di lunghezza variabile, rendendolo particolarmente adatto...