DeepSeek a făcut-o! OpenAI admite greșeala sursei închise, avantajul de lider devine mai mic

După OpenAI a lansat modelul o3-mini, directorul general Sam Altman, directorul de cercetare Mark Chen, directorul de produse Kevin Weil;

Vicepreședintele departamentului de inginerie Srinivas Narayanan, Michelle Pokrass, șeful departamentului de cercetare API, și Hongyu Ren, șeful departamentului de cercetare, au desfășurat o sesiune de întrebări și răspunsuri tehnice online pe reddit, unul dintre cele mai mari forumuri cuprinzătoare din lume.

Principalele subiecte discutate au fost situația actuală a OpenAI, planificarea viitoare a produselor și fenomenul global al modelului mare DeepSeek-R1.

Cele mai bune întrebări

Un utilizator a întrebat: "Putem vedea toate jetoanele de gândire ale modelului mare?"

Sam Altman: "Da, în curând vom prezenta o versiune mai utilă și mai detaliată. Acest lucru se datorează unei actualizări în R1.

Kevin Weil: Lucrăm să arătăm mai mult decât arătăm astăzi - acest lucru se va întâmpla în curând. Modul exact de a afișa tot conținutul nu a fost încă stabilit, dar afișarea tuturor lanțurilor de gândire ar putea duce la rafinarea concurenței.

Dar știm, de asemenea, că oamenii (cel puțin utilizatorii puternici) doresc să vadă acest lucru, așa că vom găsi calea potrivită pentru a echilibra acest lucru.

Srinivas Narayanan: Ne uităm la modalități de a arăta mai mult din procesul de gândire. Rămâneți pe recepție.

Veți lua în considerare publicarea unor modele de greutăți și publicarea unor cercetări?

Sam Altman: Da, discutăm despre asta. Cred că am ales din punct de vedere istoric partea greșită a sursei închise și trebuie să găsim o strategie diferită pentru sursa deschisă. Nu toată lumea împărtășește acest punct de vedere și nu este prioritatea noastră principală în acest moment.

Să vorbim despre subiectul fierbinte al acestei săptămâni, Deepseek. Evident, acesta este un model foarte impresionant și știu că a fost probabil antrenat pe baza rezultatelor altor modele mari. Cum va afecta acest lucru viitoarele dvs. planuri de modelare?

Sam Altman: Este un model foarte bun! Vom dezvolta modele mai bune, dar avansul nostru va fi mai mic decât în anii precedenți.

Să presupunem că suntem în 2030 și tocmai ați creat un sistem general de inteligență artificială (AGI). Acesta excelează la fiecare punct de referință pe care l-ați stabilit, depășindu-vă cei mai buni ingineri și cercetători atât în ceea ce privește viteza, cât și performanța. Ce urmează? Aveți alte planuri în afară de "lansarea pe site"?

Sam Altman: În opinia mea, cel mai important impact va fi accelerarea descoperirilor științifice, deoarece cred că acesta este factorul care va contribui cel mai mult la îmbunătățirea calității vieții.

Srinivas Narayanan: Interfața prin care interacționăm cu IA se va schimba fundamental. IA va deveni mai autonomă, procesând continuu sarcini și obiective complexe pentru noi în fundal.

Ei ne vor contacta doar atunci când va fi necesar. Robotica ar trebui, de asemenea, să fi avansat suficient pentru a putea îndeplini sarcini utile pentru noi în lumea reală. (Judecând după acest răspuns, AI Agent este într-adevăr unul dintre cele mai bune cazuri de utilizare pentru AGI).

Aparent, capacitățile avansate de dialog vocal au scăzut de când a fost lansată funcția video. Există vreun plan de remediere sau îmbunătățire a acestui aspect?

Srinivas Narayanan: Vă mulțumim pentru feedback, îl vom analiza.

De ce este termenul limită de cunoaștere pentru o3 - mini încă octombrie 2023? Este acesta și cazul pentru o3 sau o3 Pro? Există vreun plan de actualizare a termenului limită de cunoaștere?

Înainte de a plăti pentru un abonament Plus, termenul limită de cunoaștere pentru GPT - 4o era iunie 2024, dar acum că am plătit, termenul limită de cunoaștere a revenit la octombrie 2023. De ce se întâmplă acest lucru?

Sam Altman: Acum că am activat căutarea, acest lucru (data expirării cunoștințelor) este mai puțin important. Personal, nu mă voi mai gândi niciodată la data expirării cunoștințelor

La ce alți agenți AI ne putem aștepta?

Creați un agent și pentru utilizatorii gratuiți, pentru a accelera implementarea.

Vreo veste despre o nouă versiune a filmului DALL-E?

Și în cele din urmă, întrebarea pe care toată lumea o pune... când va fi realizată AGI?

Kevin Weil: Vor fi lansați mai mulți agenți, în curând, și cred că veți fi mulțumiți de ei. Generarea de imagini bazate pe 4o este la aproximativ câteva luni distanță și abia aștept să vi le arăt. Este cu adevărat grozav.

AGI se va întâmpla.

Vor exista îmbunătățiri majore la GPT-4o? Îmi place foarte mult GPT personalizat și ar fi minunat dacă ar putea fi actualizat sau dacă am putea alege ce model să folosim pe GPT personalizat (de exemplu, o3 mini).

Michelle Pokrass: Da, nu am terminat încă cu seria 4o!

Va exista o actualizare a modului vocal avansat? Va fi acesta un punct central al GPT-5o?

Sam Altman: Da, va exista o actualizare a modului vocal avansat!

Îi vom spune GPT-5, nu GPT-5o. Nu există încă un calendar.

Cât de important a fost succesul Stargate pentru viitorul OpenAI?

Kevin Weil: Foarte important. Tot ceea ce am văzut sugerează că, cu cât avem mai multă putere de calcul, cu atât putem construi modele mai bune și putem crea produse mai valoroase. Acum scalăm modelele în două dimensiuni deodată - o preinstruire mai mare și mai multă învățare prin consolidare (RL) / "căpșună" (probabil un fel de tehnologie sau nume de cod al proiectului) - și ambele necesită putere de calcul.

La fel este și furnizarea de produse către sute de milioane de utilizatori! Și este nevoie de putere de calcul pe măsură ce ne îndreptăm către produse mai inteligente care pot funcționa pentru utilizatori în mod continuu. Așa că gândiți-vă la Stargate ca la fabrica noastră care transformă electricitatea sau GPU-urile în produse extraordinare.

DeepSeek a reușit! OpenAI recunoaște greșeala sursei închise, avantajul de lider devine mai mic

Cele mai bune întrebări

Google a lansat trei modele noi simultan: Gemini-2.0-Pro este gratuit, are un scor remarcabil și se află pe primul loc și este potrivit pentru codificarea și procesarea solicitărilor complexe!

Altman: Ne-am înșelat cu privire la IA open source! DeepSeek a făcut OpenAI mai puțin avantajoasă, iar următoarea este GPT-5

Cum a fost creat DeepSeek? O analiză a istoriei de creștere a DeepSeek

Interpretarea hârtiei DeepSeek R1 și puncte tehnice cheie

Dialog a16z cu CEO în vârstă de 27 de ani: Agentul AI are un efect de pârghie uriaș, iar prețurile pe termen lung vor fi legate de costurile forței de muncă

Vești de ultimă oră! OpenAI a lansat astăzi 2 noi modele de inferență: o3-mini și o3-mini-high.

Lasă un răspuns Anulează răspunsul

Cele mai bune întrebări

Posturi similare

Lasă un răspuns Anulează răspunsul