o3-mini e o3-mini (alto) saranno rilasciati oggi.

Gli utenti abituali otterranno anche o3-minie gli utenti plus potranno utilizzare o3-mini (high).

o3-mini (alto) ha circa 200 punti in più rispetto a o1 su Codeforce, è più veloce di o1 e ha prestazioni migliori nella codifica e nella matematica, ma il costo è ancora al livello di o1-mini.

Gli utenti Plus possono utilizzare o3-mini 100 volte al giorno. Tuttavia, il limite di utilizzo di o3-mini (alto) deve essere ulteriormente confermato.

Alcuni netizen hanno detto: "Sì, R1 è così popolare che Openai non può trattenersi":

E prima, il team Alibaba Qwen ha rilasciato qwen2.5-max a Capodanno. Durante la Festa di Primavera, tutti hanno ancora bisogno di rotolare, hahaha...

In realtà, già nella trasmissione in diretta di Natale, Openai ha annunciato che o3 mini sarà disponibile all'inizio del 2025:

Dobbiamo ancora parlare di cosa sono o3 e o3-mini?

o3: Un modello di inferenza all'avanguardia che eccelle nel coding, nella matematica e persino nei test di riferimento orientati alle AGI. Stabilisce un nuovo punto di riferimento per l'intelligenza e la risoluzione dei problemi.

o3-mini: Una versione economica di o3 che offre prestazioni superiori a costi e velocità molto bassi.

Questi modelli hanno portato l'inferenza a un livello completamente nuovo, rendendo possibili progressi in compiti complessi che richiedono una comprensione e una logica approfondite.

L'o3 porta con sé tre importanti novità.

Capacità di programmazione: 71,7% di precisione nella programmazione pratica, 20% superiore a o1. 2727 punti su Codeforces, superando già il livello umano.

Livello di matematica: quasi 97% di precisione nelle qualificazioni delle Olimpiadi di Matematica degli Stati Uniti. Anche i più difficili problemi matematici di frontiera di Epic AI possono ottenere risultati di 25%.

La cosa più sorprendente è il test Arc AGI: 87,5%, superando per la prima volta gli umani in questo difficilissimo test di benchmark.

Perché l'o3-mini è un'innovazione dirompente? L'o3-mini apporta due cambiamenti.

Pensiero adattivo: la profondità del ragionamento può essere regolata in base alla difficoltà del compito, con tre modalità tra cui scegliere: bassa, media e alta.

In questo modo l'IA è più vicina agli scenari di utilizzo reali.

Evoluzione del rapporto costo-efficacia: costo inferiore a quello dell'o1-mini, risposta più rapida e risultati migliori.

Tuttavia, i netizen lamentano che o3 high consuma $1.000 per ogni compito:

Inoltre, i modelli disponibili sono davvero troppi e dobbiamo ancora confermare come passare da uno all'altro.

Messaggi simili

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *