Ultime notizie! OpenAI ha rilasciato oggi due nuovi modelli di inferenza: o3-mini e o3-mini-high.

o3-mini e o3-mini (alto) saranno rilasciati oggi.

Gli utenti abituali otterranno anche o3-minie gli utenti plus potranno utilizzare o3-mini (high).

o3-mini (alto) ha circa 200 punti in più rispetto a o1 su Codeforce, è più veloce di o1 e ha prestazioni migliori nella codifica e nella matematica, ma il costo è ancora al livello di o1-mini.

Gli utenti Plus possono utilizzare o3-mini 100 volte al giorno. Tuttavia, il limite di utilizzo di o3-mini (alto) deve essere ulteriormente confermato.

Alcuni netizen hanno detto: "Sì, R1 è così popolare che Openai non può trattenersi":

E prima, il team Alibaba Qwen ha rilasciato qwen2.5-max a Capodanno. Durante la Festa di Primavera, tutti hanno ancora bisogno di rotolare, hahaha...

In realtà, già nella trasmissione in diretta di Natale, Openai ha annunciato che o3 mini sarà disponibile all'inizio del 2025:

Indice dei contenuti

Dobbiamo ancora parlare di cosa sono o3 e o3-mini?

o3: Un modello di inferenza all'avanguardia che eccelle nel coding, nella matematica e persino nei test di riferimento orientati alle AGI. Stabilisce un nuovo punto di riferimento per l'intelligenza e la risoluzione dei problemi.

o3-mini: Una versione economica di o3 che offre prestazioni superiori a costi e velocità molto bassi.

Questi modelli hanno portato l'inferenza a un livello completamente nuovo, rendendo possibili progressi in compiti complessi che richiedono una comprensione e una logica approfondite.

L'o3 porta con sé tre importanti novità.

Capacità di programmazione: 71,7% di precisione nella programmazione pratica, 20% superiore a o1. 2727 punti su Codeforces, superando già il livello umano.

Livello di matematica: quasi 97% di precisione nelle qualificazioni delle Olimpiadi di Matematica degli Stati Uniti. Anche i più difficili problemi matematici di frontiera di Epic AI possono ottenere risultati di 25%.

La cosa più sorprendente è il test Arc AGI: 87,5%, superando per la prima volta gli umani in questo difficilissimo test di benchmark.

Perché l'o3-mini è un'innovazione dirompente? L'o3-mini apporta due cambiamenti.

Pensiero adattivo: la profondità del ragionamento può essere regolata in base alla difficoltà del compito, con tre modalità tra cui scegliere: bassa, media e alta.

In questo modo l'IA è più vicina agli scenari di utilizzo reali.

Evoluzione del rapporto costo-efficacia: costo inferiore a quello dell'o1-mini, risposta più rapida e risultati migliori.

Tuttavia, i netizen lamentano che o3 high consuma $1.000 per ogni compito:

Inoltre, i modelli disponibili sono davvero troppi e dobbiamo ancora confermare come passare da uno all'altro.

Senza categoria

Il segreto dietro DeepSeek 1 | Dettagli su DeepSeekMath e GRPO

Dazddeepseeker 9 Febbraio 20259 Febbraio 2025

Oggi vorrei condividere un articolo di DeepSeek, intitolato DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Questo articolo introduce DeepSeekMath 7B, che è pre-addestrato su DeepSeek-Coder-Base-v1.5 7B basato su una raccolta di 120B token correlati alla matematica, linguaggio naturale e dati di codice. Il modello ha ottenuto un punteggio sorprendente di 51,7% a livello competitivo…

Senza categoria

Qwen2.5-max vs DeepSeek R1: un confronto approfondito dei modelli: un'analisi completa degli scenari applicativi

Dazddeepseeker 14 Febbraio 202514 Febbraio 2025

Introduzione Oggi, i modelli linguistici di grandi dimensioni (LLM) svolgono un ruolo cruciale. All'inizio del 2025, con l'intensificarsi della competizione per l'IA, Alibaba ha lanciato il nuovo modello di IA Qwen2.5-max e DeepSeek, un'azienda di Hangzhou, Cina, ha lanciato il modello R1, che rappresenta l'apice della tecnologia LLM. Deepseek R1 è un modello di IA open source che ha attratto...

Senza categoria

Che cosa è FlashMLA? Una guida completa al suo impatto sui kernel di decodifica AI

Dadeepseeker 24 Febbraio 202524 Febbraio 2025

FlashMLA ha rapidamente attirato l'attenzione nel mondo dell'intelligenza artificiale, in particolare nel campo dei grandi modelli linguistici (LLM). Questo strumento innovativo, sviluppato da DeepSeek, funge da kernel di decodifica ottimizzato progettato per le GPU Hopper, chip ad alte prestazioni comunemente utilizzati nei calcoli di intelligenza artificiale. FlashMLA si concentra sull'elaborazione efficiente di sequenze di lunghezza variabile, rendendolo particolarmente adatto...

Senza categoria

Gemini 2.0 domina le classifiche, mentre DeepSeek V3 piange nel prezzo, ed è nato un nuovo campione conveniente!

Dazddeepseeker 8 Febbraio 20258 Febbraio 2025

La famiglia Google Gemini 2.0 è finalmente completa! Domina le classifiche non appena viene rilasciata. Tra l'inseguimento e i blocchi di Deepseek, Qwen e o3, Google ha rilasciato tre modelli in una volta sola questa mattina presto: Gemini 2.0 Pro, Gemini 2.0 Flash e Gemini 2.0 Flash-Lite. Nella classifica dei modelli grandi LMSYS, Gemini…

Senza categoria

Ali Qwen2.5-Max supera DeepSeek-V3! Netizen: l'intelligenza artificiale cinese sta rapidamente colmando il divario

Dazddeepseeker 5 Febbraio 20255 Febbraio 2025

Proprio ora, un altro modello nazionale è stato aggiunto alla lista Big Model Arena da Ali, Qwen2.5-Max, che ha superato DeepSeek-V3 e si è classificato settimo nella classifica generale con un punteggio totale di 1332. Ha anche superato modelli come Claude 3.5 Sonnet e Llama 3.1 405B in un colpo solo. In particolare, eccelle nella programmazione…

Senza categoria

È vicino a DeepSeek-R1-32B e schiaccia l's1 di Fei-Fei Li! UC Berkeley e altri nuovi modelli di inferenza SOTA open source

Dazddeepseeker 14 Febbraio 202514 Febbraio 2025

Il modello di inferenza 32B utilizza solo 1/8 dei dati ed è alla pari con DeepSeek-R1 delle stesse dimensioni! Proprio ora, istituzioni come Stanford, UC Berkeley e l'Università di Washington hanno rilasciato congiuntamente un modello di inferenza di livello SOTA, OpenThinker-32B, e hanno anche reso open source fino a 114k dati di training. Homepage del progetto OpenThinker: OpenThinker Hugging Face:…

Dobbiamo ancora parlare di cosa sono o3 e o3-mini?

L'o3 porta con sé tre importanti novità.

Perché l'o3-mini è un'innovazione dirompente? L'o3-mini apporta due cambiamenti.

Messaggi simili

Lascia un commento Annulla risposta