DeepSeek ce l'ha fatta! OpenAI ammette l'errore del closed source, il vantaggio del vantaggio diventa più piccolo

Dopo OpenAI ha rilasciato il modello o3-mini, il suo CEO Sam Altman, il Chief Research Officer Mark Chen, il Chief Product Officer Kevin Weil;

Il vicepresidente della divisione ingegneria Srinivas Narayanan, la responsabile della ricerca API Michelle Pokrass e il responsabile della ricerca Hongyu Ren hanno condotto un'intervista tecnica online su reddit, uno dei più grandi forum al mondo.

I principali argomenti discussi sono stati la situazione attuale di OpenAI, la pianificazione dei prodotti futuri e il fenomeno globale del grande modello DeepSeek-R1.

Le domande migliori

Un utente ha chiesto: "Possiamo vedere tutti i gettoni di pensiero del modello grande?".

Sam Altman: "Sì, presto mostreremo una versione più utile e dettagliata. Questo grazie a un aggiornamento in R1.

Kevin Weil: Stiamo lavorando per mostrare più di quanto mostriamo oggi: questo accadrà presto. Il modo esatto di mostrare tutti i contenuti è ancora da definire, ma mostrare tutte le catene di pensiero potrebbe portare a un perfezionamento della concorrenza.

Ma sappiamo anche che le persone (almeno i power user) vogliono vedere questo aspetto, quindi troveremo il modo giusto per trovare un equilibrio.

Srinivas Narayanan: Stiamo studiando come mostrare maggiormente il processo di pensiero. Restate sintonizzati.

Prenderete in considerazione la possibilità di rilasciare alcuni pesi modello e di pubblicare alcune ricerche?

Sam Altman: Sì, ne stiamo discutendo. Credo che abbiamo scelto il lato storicamente sbagliato del closed source e dobbiamo trovare una strategia diversa per l'open source. Non tutti condividono questo punto di vista e al momento non è la nostra massima priorità.

Parliamo dell'argomento caldo di questa settimana, Deepseek. Ovviamente si tratta di un modello davvero impressionante e so che probabilmente è stato addestrato sulla base dei risultati di altri grandi modelli. In che modo questo influenzerà i vostri piani futuri per i modelli?

Sam Altman: È un modello molto buono! Svilupperemo modelli migliori, ma il nostro vantaggio sarà minore rispetto agli anni precedenti.

Supponiamo che sia il 2030 e che abbiate appena creato un sistema di intelligenza artificiale generale (AGI). Eccelle in tutti i parametri di riferimento che avete stabilito, superando i vostri migliori ingegneri e ricercatori sia in termini di velocità che di prestazioni. Qual è il prossimo passo? Avete altri piani oltre a "lanciarlo sul sito web"?

Sam Altman: L'impatto più importante, a mio avviso, sarà quello di accelerare la scoperta scientifica, perché credo che questo sia il fattore che contribuirà maggiormente a migliorare la qualità della vita.

Srinivas Narayanan: L'interfaccia con cui interagiamo con l'IA cambierà radicalmente. L'IA diventerà più autonoma, elaborando continuamente compiti e obiettivi complessi per noi in background.

Ci contatteranno solo in caso di necessità. La robotica dovrebbe anche essere sufficientemente avanzata da essere in grado di svolgere compiti utili per noi nel mondo reale. (A giudicare da questa risposta, l'agente di intelligenza artificiale è effettivamente uno dei migliori casi d'uso per l'AGI).

Le capacità di dialogo vocale avanzato sono apparentemente diminuite da quando è stata rilasciata la funzione video. Ci sono piani per risolvere o migliorare questo problema?

Srinivas Narayanan: Grazie per il feedback, lo esamineremo.

Perché la scadenza per la conoscenza del o3 - mini ancora ottobre 2023? È così anche per l'o3 o l'o3 Pro? È previsto un aggiornamento del termine di conoscenza?

Prima di pagare l'abbonamento Plus, la scadenza delle conoscenze per GPT - 4o era giugno 2024, ma ora che ho pagato, la scadenza delle conoscenze è tornata a ottobre 2023. Come mai?

Sam Altman: Ora che abbiamo abilitato la ricerca, questo aspetto (la data di scadenza delle conoscenze) è meno importante. Personalmente, non penserò mai più alla data di scadenza delle conoscenze.

Quali altri agenti AI possiamo aspettarci?

Creare un agente anche per gli utenti gratuiti, per accelerare il rollout.

Ci sono novità su una nuova versione di DALL-E?

E infine, la domanda che tutti si pongono... quando si raggiungerà l'AGI?

Kevin Weil: Verranno rilasciati altri agenti, a breve, e credo che ne sarete soddisfatti. La generazione di immagini basata su 4o è in arrivo tra qualche mese e non vedo l'ora di mostrarvela. È davvero fantastico.

L'AGI si farà.

Ci saranno grandi miglioramenti per GPT-4o? Mi piace molto la GPT personalizzata, e sarebbe fantastico se potesse essere aggiornata, o se potessimo scegliere quale modello utilizzare sulla GPT personalizzata (ad esempio o3 mini).

Michelle Pokrass: Sì, non abbiamo ancora finito con la serie 4o!

Ci sarà un aggiornamento della modalità vocale avanzata? Sarà un punto focale del GPT-5o?

Sam Altman: Sì, ci sarà un aggiornamento della modalità vocale avanzata!

Lo chiameremo GPT-5, non GPT-5o. Non c'è ancora un calendario.

Quanto è stato importante il successo di Stargate per il futuro di OpenAI?

Kevin Weil: Molto importante. Tutto ciò che abbiamo visto suggerisce che più potenza di calcolo abbiamo, migliori sono i modelli che possiamo costruire e più validi sono i prodotti che possiamo creare. Ora stiamo scalando i modelli in due dimensioni contemporaneamente: un preallenamento più ampio e un apprendimento per rinforzo (RL) / "fragola" (probabilmente una sorta di nome in codice della tecnologia o del progetto), ed entrambi richiedono potenza di calcolo.

Lo stesso vale per la fornitura di prodotti a centinaia di milioni di utenti! E questo richiede potenza di calcolo, in quanto ci muoviamo verso prodotti più intelligenti che possono lavorare per gli utenti su base continuativa. Pensate quindi a Stargate come alla nostra fabbrica che trasforma l'elettricità o le GPU in grandi prodotti.

Messaggi simili

Senza categoria

Cosa può realizzare Deepseek? Nemmeno OpenAI può farlo?

Dazddeepseeker 10 Febbraio 202510 Febbraio 2025

Il vero valore di DeepSeek è sottovalutato! DeepSeek-R1 ha indubbiamente portato una nuova ondata di entusiasmo sul mercato. Non solo i cosiddetti target beneficiari rilevanti stanno aumentando rapidamente, ma alcune persone hanno persino sviluppato corsi e software correlati a DeepSeek nel tentativo di trarne profitto. Crediamo che, sebbene questi fenomeni abbiano un…

Senza categoria

Paper-DeepSeek-R1: Incentivare la capacità di ragionamento nei LLM attraverso l'apprendimento per rinforzo

Dadeepseeker Gennaio 29, 2025Gennaio 29, 2025

Abstract Questo documento presenta i modelli di ragionamento DeepSeek di prima generazione: DeepSeek-R1-Zero e DeepSeek-R1. DeepSeek-R1-Zero, addestrato attraverso l'apprendimento per rinforzo (RL) su larga scala senza messa a punto supervisionata (SFT), dimostra notevoli capacità di ragionamento. Grazie all'RL, sviluppa naturalmente potenti comportamenti di ragionamento. Tuttavia, deve affrontare problemi come la scarsa leggibilità e la mescolanza del linguaggio. Per affrontare questi problemi e migliorare le prestazioni di ragionamento, è stato sviluppato DeepSeek-R1,...

Senza categoria

La sfida dei quattro migliori modelli! Una recensione mostra la potenza del Deepseek R1

Dazddeepseeker 1 giugno 20251 giugno 2025

Negli ultimi giorni, Deepseek-R1 0528 è stato ufficialmente rilasciato come open source. Su LiveCodeBench, le sue prestazioni sono quasi alla pari con quelle di o3 di OpenAI (alte); nel benchmark multilingua di Aider, regge il confronto con Claude Opus. Quando è stato lanciato sul sito web ufficiale, ne abbiamo testato rapidamente le funzionalità front-end e le abbiamo trovate eccezionalmente...

Senza categoria

DeepSeek ha rilasciato il suo codice sorgente, spiegazione dettagliata di FlashMLA

Dazddeepseeker 24 Febbraio 202524 Febbraio 2025

La scorsa settimana, DeepSeek ha annunciato che avrebbe reso open source cinque progetti la prossima settimana: i netizen hanno detto, "Questa volta, OpenAI è davvero qui". Proprio ora, è arrivato il primo progetto open source, relativo all'accelerazione dell'inferenza, FlashMLA: Indirizzo del progetto open source: DeepSeek FlashMLA È open source da due ore e Github ha già 2,7k+ stelle: Il…

Senza categoria

È vicino a DeepSeek-R1-32B e schiaccia l's1 di Fei-Fei Li! UC Berkeley e altri nuovi modelli di inferenza SOTA open source

Dazddeepseeker 14 Febbraio 202514 Febbraio 2025

Il modello di inferenza 32B utilizza solo 1/8 dei dati ed è alla pari con DeepSeek-R1 delle stesse dimensioni! Proprio ora, istituzioni come Stanford, UC Berkeley e l'Università di Washington hanno rilasciato congiuntamente un modello di inferenza di livello SOTA, OpenThinker-32B, e hanno anche reso open source fino a 114k dati di training. Homepage del progetto OpenThinker: OpenThinker Hugging Face:…

Senza categoria

Ultime notizie! OpenAI ha rilasciato oggi due nuovi modelli di inferenza: o3-mini e o3-mini-high.

Dazddeepseeker 1 febbraio 20251 febbraio 2025

o3-mini e o3-mini (high) saranno rilasciati oggi. Gli utenti abituali riceveranno anche o3-mini, mentre gli utenti plus potranno utilizzare o3-mini (high). o3-mini (high) ha circa 200 punti in più rispetto a o1 su Codeforce, è più veloce di o1 e ha prestazioni migliori nel coding e nella matematica, ma il costo è ancora al livello di o1-mini....

Le domande migliori

Messaggi simili

Lascia un commento Annulla risposta