o3-mini saapui myöhään illalla, ja OpenAI paljasti viimein uusimman valttikorttinsa. Reddit AMA Q&A:n aikana Altman tunnusti syvästi, että hän oli seissyt avoimen lähdekoodin tekoälyn väärällä puolella.

Hän sanoi, että avoimen lähdekoodin sisäistä strategiaa harkitaan, ja mallia kehitetään edelleen, mutta OpenAI:n etumatka ei ole yhtä suuri kuin aiemmin.

Kun kaikki vielä ihmettelivät DeepSeek:n hämmästyttävää tehoa, OpenAI ei lopulta voinut enää istua paikallaan.

Varhain aamulla eilen, o3-mini käynnistettiin kiireellisesti, asettamalla uusi SOTA benchmark-testeissä, kuten matemaattisen koodin ja paluu valtaistuimelle.

Tärkeintä on, että myös ilmaiskäyttäjät voivat kokea sen! o3-mini ei ole mikään vitsi. "Ihmisten viimeisessä kokeessa" o3-mini (korkea) saavutti suoraan parhaan tarkkuuden ja kalibrointivirheen.

Muutaman tunnin kuluttua o3-mini meni verkkoonOpenAI avasi virallisesti Reddit AMA:n noin tunnin ajaksi.

Altman itse meni myös nettiin ja vastasi kaikkiin nettikansalaisten kysymyksiin.

Tärkeimmät kohokohdat ovat:

  • DeepSeek on todellakin erittäin hyvä, ja kehitämme edelleen parempia malleja, mutta etumatka ei ole enää yhtä suuri kuin aiemmin.
  • Muutaman vuoden takaiseen verrattuna olen nyt taipuvaisempi uskomaan, että tekoäly voi kokea nopeita harppauksia.
  • Olemme väärällä puolella painotettujen tekoälymallien avoimen ulkoistamisen kysymyksessä.
  • Edistyneen äänitilan päivitys on tulossa pian, ja kutsumme sitä suoraan GPT-5:ksi, emme GPT-5o:ksi. Tarkkaa aikataulua ei vielä ole.

Altmanin itsensä lisäksi tutkimusjohtaja Mark Chen, tuotepäällikkö Kevin Weil, tekninen johtaja Srinivas Narayanan, API-tutkimuksen johtaja Michelle Pokrass ja tutkimusjohtaja Hongyu Ren olivat myös verkossa ja vastasivat huolellisesti kaikkiin nettikansalaisten kysymyksiin.

Seuraavaksi katsotaan, mitä he kaikki sanoivat.

Altman katuu syvästi, että hän oli väärällä puolella avoimen lähdekoodin tekoälytaistelussa

DeepSeek:n äkillinen paluu on saattanut olla kaikille odottamaton.

AMA:n kyselytunnilla Altman katui myös syvästi sitä, että hän oli asettunut väärälle puolelle avoimen lähdekoodin tekoälytaistelussa, ja hänen oli myönnettävä DeepSeek:n vahvat edut.

Monia hämmästytti se, että Altman jopa sanoi, että OpenAI:n johtoasema ei ollut enää niin vahva kuin ennen.

Seuraavassa on kaikki Altmanin klassiset vastaukset.

K: Puhutaanpa viikon suuresta aiheesta: Deepseek. Se on selvästi erittäin vaikuttava malli, ja tiedän, että se on luultavasti koulutettu muiden LLM:ien tuotosten pohjalta. Miten tämä muuttaa tulevia malleja koskevia suunnitelmiasi?

Altman: Se on todellakin erittäin vaikuttava malli! Kehitämme parempia malleja, mutta emme pysty pitämään yhtä suurta etumatkaa kuin aiempina vuosina.

K: Uskotko, että rekursiivinen itsensä kehittäminen on asteittainen prosessi vai äkillinen nousu?

Altman: Henkilökohtaisesti uskon, että tekoäly voi edetä nopeasti, mutta olen nyt taipuvaisempi uskomaan siihen kuin muutama vuosi sitten. Ehkä on aika kirjoittaa jotain tästä aiheesta...

K: Voimmeko nähdä kaikki mallin ajattelemat merkit?

Altman: Kyllä, näytämme pian hyödyllisemmän ja yksityiskohtaisemman version. Kiitos R1:lle päivityksestä.

Kevin Weil, tuotepäällikkö: Tämä tapahtuu pian. Näytämmekö kaiken vai emme, se jää nähtäväksi. Kaikkien ajatusketjujen (CoT) näyttäminen johtaisi kilpailijamallien tislaamiseen, mutta tiedämme myös, että käyttäjät (ainakin edistyneet käyttäjät) haluavat nähdä tämän, joten löydämme hyvän tasapainon.

K: Milloin o3:n täysversio on saatavilla?

Altman: Arvioisin, että se kestää enemmän kuin muutaman viikon, mutta ei enempää kuin muutaman kuukauden.

K: Tuleeko äänitilaan päivitys? Onko tämä mahdollisesti yksi GPT-5o:n painopisteistä? Mikä on GPT-5o:n karkea aikataulu?

Altman: Kyllä, päivitys kehittyneeseen äänitilaan on tulossa! Luulen, että kutsumme sitä vain GPT-5:ksi, emme GPT-5o:ksi. Tarkkaa aikataulua ei vielä ole.

K: Voisitteko harkita mallipainojen julkaisemista ja tutkimusten julkaisemista?

Altman: Kyllä, keskustelemme siitä. Olen itse sitä mieltä, että olemme väärällä puolella tässä asiassa ja meidän on kehitettävä erilainen avoimen lähdekoodin strategia. Kaikki OpenAI:ssa eivät ole samaa mieltä, eikä se ole tällä hetkellä tärkein prioriteettimme.

Vielä yksi kysymyssarja:

  • Kuinka lähellä olemme Operatorin tarjoamista tavallisessa Plus-ohjelmassa?
  • Mitkä ovat robotiikkaosaston tärkeimmät painopisteet?
  • Mitä mieltä OpenAI on erikoistuneemmista siruista/TPU:ista, kuten Trillium, Cerebras jne.? Kiinnittääkö OpenAI huomiota tähän?
  • Mitä investointeja tehdään AGI:n ja ASI:n tulevien riskien suojaamiseksi?
  • Mikä oli mieleenpainuvin lomasi?

Altman:

  • Muutama kuukausi
  • valmistaa todella hyvä robotti pienessä mittakaavassa ja oppia kokemuksesta.
  • GB200 on tällä hetkellä vaikea voittaa!
  • Hyvä valinta olisi parantaa sisäistä tilaasi - joustavuutta, sopeutumiskykyä, rauhallisuutta, iloa jne.
  • Vaikea valita! Mutta ensimmäiset kaksi, jotka tulevat mieleen, ovat: reppureissaaminen Kaakkois-Aasiassa tai safari Afrikassa.

K: Aiotteko nostaa Plus-sarjan hintaa?

Altman: Itse asiassa haluan vähentää sitä vähitellen.

K: Oletetaan, että nyt on vuosi 2030, ja olet juuri luonut järjestelmän, jota useimmat ihmiset kutsuisivat AGI:ksi. Se menestyy erinomaisesti kaikissa vertailutesteissä ja päihittää parhaat insinöörisi ja tutkijasi nopeudessa ja suorituskyvyssä. Mitä seuraavaksi? Onko teillä muita suunnitelmia sen lisäksi, että "laitatte sen verkkosivuille ja tarjoatte sitä palveluna"?

Altman: Tärkein vaikutus on mielestäni tieteellisten keksintöjen nopeuttaminen, mikä on mielestäni se tekijä, joka vaikuttaa eniten elämänlaadun parantamiseen.

4o kuvien luominen, tulossa pian

Seuraavaksi lisättiin muiden OpenAI:n jäsenten vastaukset.

K: Suunnitteletteko yhä 4o-kuvageneraattorin käyttöönottoa?

Kevin Weil, tuotepäällikkö: Weil: Kyllä! Ja uskon, että odotus on sen arvoista.

K: Hienoa! Onko olemassa karkea aikataulu?

Kevin Weil, tuotepäällikkö: Weil: Pyydät minua joutumaan vaikeuksiin. Ehkä muutamaksi kuukaudeksi.

Ja toinen samanlainen kysymys.

K: Milloin voimme odottaa näkevämme ChatGPT-5:n?

Kevin Weil, tuotepäällikkö: Pian o-17 micro ja GPT-(π+1) jälkeen.

Ja toinenkin kysymys nousee esiin:

  • Minkälaisia muita aineita on odotettavissa?
  • Ja myös tarjota agentti ilmaiskäyttäjille, mikä voisi nopeuttaa käyttöönottoa....
  • Onko DALL-E:n uudesta versiosta mitään uutta tietoa?
  • Vielä yksi kysymys, jota kaikki kysyvät: Milloin AGI otetaan käyttöön?

Kevin Weil, tuotepäällikkö:

  • Lisää agentteja: hyvin, hyvin pian. Luulen, että olet iloinen.
  • Kuvan luominen 4o:n perusteella: muutaman kuukauden kuluttua, en malta odottaa, että pääset käyttämään sitä. Se on hieno.
  • AGI: Kyllä

K: Aiotteko lisätä tiedostojen liitetoimintoja päättelymalliin?

Srinivas Narayanan, tekninen johtaja: Naranas Narrin Naranas Naranas: Se on kehitteillä. Tulevaisuudessa päättelymallissa voidaan käyttää erilaisia työkaluja, kuten hakutoimintoja.

Kevin Weil, tuotepäällikkö: En malta odottaa, että pääsen näkemään, miten perustelumalli pystyy käyttämään työkaluja.

K: Todellakin. Kun tämä ongelma ratkaistaan, avautuu joitakin erittäin hyödyllisiä tekoälyn sovelluskohteita. Kuvittele, että se pystyy ymmärtämään 500 Gt:n työasiakirjojesi sisällön.

Kun olet vastaamassa sähköpostiin, sähköpostisovelluksen viereen aukeaa paneeli, joka analysoi jatkuvasti kaikkia kyseiseen henkilöön liittyviä tietoja, mukaan lukien suhteenne, keskustelunaiheet, aiemmat työt jne. Ehkä jokin kauan sitten unohtamastasi asiakirjasta merkitään, koska se on erittäin merkityksellinen nykyisen keskustelun kannalta. Haluan tämän ominaisuuden niin kovasti.

Srinivas Narayanan, tekninen johtaja: Asiayhteyden pituuden lisääminen on työn alla. Vielä ei ole varmaa päivämäärää/ilmoitusta.

K: Kuinka tärkeä Stargate-projekti on OpenAI:n tulevaisuudelle? Kevin Weil, tuotepäällikkö: Weil: Erittäin tärkeää. Kaikki näkemämme viittaa siihen, että mitä enemmän laskentatehoa meillä on, sitä parempia malleja voimme rakentaa ja sitä arvokkaampia tuotteita voimme luoda.

Skaalautamme malleja juuri nyt kahdella ulottuvuudella - suuremmalla esivalmennuksella ja vahvistusoppimisen (RL)/"mansikka"-valmennuksella, jotka molemmat vaativat laskentaresursseja.

Satojen miljoonien käyttäjien palveleminen vaatii myös laskentaresursseja! Ja kun siirrymme kohti älykkäämpiä agenttituotteita, jotka voivat työskennellä puolestasi jatkuvasti, myös tämä vaatii laskentaresursseja. Voit siis ajatella, että Stargate on tehtaamme, jossa sähkö/GPU:t muunnetaan upeiksi tuotteiksi.

K: Mitä mallia käytätte nyt? o4, o5 vai o6? Kuinka paljon älykkäämpiä nämä sisäiset mallit ovat o3:een verrattuna?

Michelle Pokrass, API-tutkimuksen johtaja: Pokrass: Olemme menettäneet laskennan.

K: Sallikaa meidän olla vuorovaikutuksessa tekstin/kanvaasin kanssa ja käyttää samalla kehittyneitä äänitoimintoja. Haluan pystyä puhumaan sille ja saada sen muuttamaan asiakirjoja toistuvasti.

Kevin Weil, tuotepäällikkö: Weil: Kyllä! Meillä on paljon hienoja työkaluja, jotka on kehitetty suhteellisen itsenäisesti - tavoitteena on saada nämä työkalut käsiinne mahdollisimman nopeasti.

Seuraava askel on integroida kaikki nämä ominaisuudet niin, että voit keskustella mallin kanssa, joka etsii ja perustelee samanaikaisesti, ja luoda kankaan, jolla voidaan käyttää Pythonia. Kaikkien työkalujen on toimittava paremmin yhdessä. Ja muuten, kaikki mallit tarvitsevat täydet työkalut (o-sarjan mallit eivät tällä hetkellä voi käyttää kaikkia työkaluja), mikä myös toteutetaan.

K: Milloin o-sarjan mallit tukevat ChatGPT:n muistitoimintoa?

Michelle Pokrass, API-tutkimuksen johtaja: Pokrass: Se on kehitteillä! Kaikkien ominaisuuksiemme yhtenäistäminen o-sarjan mallien kanssa on ensisijainen tavoitteemme.

K: Tuleeko 4o:een merkittäviä parannuksia? Pidän todella paljon mukautetusta GPT:stä, ja olisi hienoa, jos sitä voitaisiin päivittää tai jos voisimme valita, mitä mallia käytämme mukautetussa GPT:ssä (kuten o3 mini).

Michelle Pokrass, API-tutkimuksen johtaja: Kyllä, emme ole vielä lopettaneet 4o-sarjaa!

Samankaltaisia viestejä

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *