Dopo OpenAI ha rilasciato il modello o3-mini, il suo CEO Sam Altman, il Chief Research Officer Mark Chen, il Chief Product Officer Kevin Weil;
Il vicepresidente della divisione ingegneria Srinivas Narayanan, la responsabile della ricerca API Michelle Pokrass e il responsabile della ricerca Hongyu Ren hanno condotto un'intervista tecnica online su reddit, uno dei più grandi forum al mondo.
I principali argomenti discussi sono stati la situazione attuale di OpenAI, la pianificazione dei prodotti futuri e il fenomeno globale del grande modello DeepSeek-R1.
Le domande migliori
Un utente ha chiesto: "Possiamo vedere tutti i gettoni di pensiero del modello grande?".
Sam Altman: "Sì, presto mostreremo una versione più utile e dettagliata. Questo grazie a un aggiornamento in R1.
Kevin Weil: Stiamo lavorando per mostrare più di quanto mostriamo oggi: questo accadrà presto. Il modo esatto di mostrare tutti i contenuti è ancora da definire, ma mostrare tutte le catene di pensiero potrebbe portare a un perfezionamento della concorrenza.
Ma sappiamo anche che le persone (almeno i power user) vogliono vedere questo aspetto, quindi troveremo il modo giusto per trovare un equilibrio.
Srinivas Narayanan: Stiamo studiando come mostrare maggiormente il processo di pensiero. Restate sintonizzati.
Prenderete in considerazione la possibilità di rilasciare alcuni pesi modello e di pubblicare alcune ricerche?
Sam Altman: Sì, ne stiamo discutendo. Credo che abbiamo scelto il lato storicamente sbagliato del closed source e dobbiamo trovare una strategia diversa per l'open source. Non tutti condividono questo punto di vista e al momento non è la nostra massima priorità.
Parliamo dell'argomento caldo di questa settimana, Deepseek. Ovviamente si tratta di un modello davvero impressionante e so che probabilmente è stato addestrato sulla base dei risultati di altri grandi modelli. In che modo questo influenzerà i vostri piani futuri per i modelli?
Sam Altman: È un modello molto buono! Svilupperemo modelli migliori, ma il nostro vantaggio sarà minore rispetto agli anni precedenti.
Supponiamo che sia il 2030 e che abbiate appena creato un sistema di intelligenza artificiale generale (AGI). Eccelle in tutti i parametri di riferimento che avete stabilito, superando i vostri migliori ingegneri e ricercatori sia in termini di velocità che di prestazioni. Qual è il prossimo passo? Avete altri piani oltre a "lanciarlo sul sito web"?
Sam Altman: L'impatto più importante, a mio avviso, sarà quello di accelerare la scoperta scientifica, perché credo che questo sia il fattore che contribuirà maggiormente a migliorare la qualità della vita.
Srinivas Narayanan: L'interfaccia con cui interagiamo con l'IA cambierà radicalmente. L'IA diventerà più autonoma, elaborando continuamente compiti e obiettivi complessi per noi in background.
Ci contatteranno solo in caso di necessità. La robotica dovrebbe anche essere sufficientemente avanzata da essere in grado di svolgere compiti utili per noi nel mondo reale. (A giudicare da questa risposta, l'agente di intelligenza artificiale è effettivamente uno dei migliori casi d'uso per l'AGI).
Le capacità di dialogo vocale avanzato sono apparentemente diminuite da quando è stata rilasciata la funzione video. Ci sono piani per risolvere o migliorare questo problema?
Srinivas Narayanan: Grazie per il feedback, lo esamineremo.
Perché la scadenza per la conoscenza del o3 - mini ancora ottobre 2023? È così anche per l'o3 o l'o3 Pro? È previsto un aggiornamento del termine di conoscenza?
Prima di pagare l'abbonamento Plus, la scadenza delle conoscenze per GPT - 4o era giugno 2024, ma ora che ho pagato, la scadenza delle conoscenze è tornata a ottobre 2023. Come mai?
Sam Altman: Ora che abbiamo abilitato la ricerca, questo aspetto (la data di scadenza delle conoscenze) è meno importante. Personalmente, non penserò mai più alla data di scadenza delle conoscenze.
Quali altri agenti AI possiamo aspettarci?
Creare un agente anche per gli utenti gratuiti, per accelerare il rollout.
Ci sono novità su una nuova versione di DALL-E?
E infine, la domanda che tutti si pongono... quando si raggiungerà l'AGI?
Kevin Weil: Verranno rilasciati altri agenti, a breve, e credo che ne sarete soddisfatti. La generazione di immagini basata su 4o è in arrivo tra qualche mese e non vedo l'ora di mostrarvela. È davvero fantastico.
L'AGI si farà.
Ci saranno grandi miglioramenti per GPT-4o? Mi piace molto la GPT personalizzata, e sarebbe fantastico se potesse essere aggiornata, o se potessimo scegliere quale modello utilizzare sulla GPT personalizzata (ad esempio o3 mini).
Michelle Pokrass: Sì, non abbiamo ancora finito con la serie 4o!
Ci sarà un aggiornamento della modalità vocale avanzata? Sarà un punto focale del GPT-5o?
Sam Altman: Sì, ci sarà un aggiornamento della modalità vocale avanzata!
Lo chiameremo GPT-5, non GPT-5o. Non c'è ancora un calendario.
Quanto è stato importante il successo di Stargate per il futuro di OpenAI?
Kevin Weil: Molto importante. Tutto ciò che abbiamo visto suggerisce che più potenza di calcolo abbiamo, migliori sono i modelli che possiamo costruire e più validi sono i prodotti che possiamo creare. Ora stiamo scalando i modelli in due dimensioni contemporaneamente: un preallenamento più ampio e un apprendimento per rinforzo (RL) / "fragola" (probabilmente una sorta di nome in codice della tecnologia o del progetto), ed entrambi richiedono potenza di calcolo.
Lo stesso vale per la fornitura di prodotti a centinaia di milioni di utenti! E questo richiede potenza di calcolo, in quanto ci muoviamo verso prodotti più intelligenti che possono lavorare per gli utenti su base continuativa. Pensate quindi a Stargate come alla nostra fabbrica che trasforma l'elettricità o le GPU in grandi prodotti.