Jälkeen OpenAI julkaisi o3-mini-mallin, sen toimitusjohtaja Sam Altman, tutkimusjohtaja Mark Chen ja tuotejohtaja Kevin Weil;
Tekniikan johtaja Srinivas Narayanan, API-tutkimuksen johtaja Michelle Pokrass ja tutkimuspäällikkö Hongyu Ren suorittivat teknisen verkkokyselyn ja -vastauksen redditissä, joka on yksi maailman suurimmista kattavista foorumeista.
Tärkeimmät keskustelunaiheet olivat OpenAI:n nykytilanne, tuleva tuotesuunnittelu ja suuren DeepSeek-R1-mallin maailmanlaajuinen ilmiö.
Parhaat kysymykset
Eräs käyttäjä kysyi: "Voimmeko nähdä kaikki suuren mallin ajattelumerkit?"
Sam Altman: "Kyllä, näytämme pian hyödyllisemmän ja yksityiskohtaisemman version. Tämä johtuu päivityksestä osoitteessa R1.
Kevin Weil: Tämä tapahtuu pian. Tarkka tapa näyttää kaikki sisältö on vielä määrittelemättä, mutta kaikkien ajatusketjujen näyttäminen voisi johtaa kilpailulliseen hienosäätöön.
Tiedämme kuitenkin myös, että ihmiset (ainakin tehokäyttäjät) haluavat nähdä tämän, joten löydämme oikean tavan tasapainottaa tämä.
Srinivas Narayanan: Sara Narrinivas: Etsimme keinoja näyttää enemmän ajatuksen kulkua. Pysy kuulolla.
Voisitteko harkita mallipainojen julkaisemista ja tutkimusten julkaisemista?
Sam Altman: Kyllä, keskustelemme siitä. Luulen, että olemme valinneet historiallisesti väärän puolen suljetun lähdekoodin ja että meidän on keksittävä erilainen avoimen lähdekoodin strategia. Kaikki eivät ole tätä mieltä, eikä se ole tällä hetkellä ensisijainen tavoitteemme.
Puhutaanpa tämän viikon kuumasta aiheesta, Deepseekistä. Tämä on tietenkin erittäin vaikuttava malli, ja tiedän, että se on luultavasti koulutettu muiden suurten mallien tuotosten perusteella. Miten tämä vaikuttaa tuleviin mallisuunnitelmiinne?
Sam Altman: Se on erittäin hyvä malli! Kehitämme parempia malleja, mutta etumatka on pienempi kuin aiempina vuosina.
Oletetaan, että eletään vuotta 2030 ja olet juuri luonut yleisen tekoälyjärjestelmän (AGI). Se on erinomainen kaikissa asettamissasi vertailuarvoissa ja päihittää parhaat insinöörisi ja tutkijasi sekä nopeudessa että suorituskyvyssä. Mitä seuraavaksi? Onko muita suunnitelmia kuin "julkaise se verkkosivustolla"?
Sam Altman: Tärkein vaikutus on mielestäni tieteellisten keksintöjen nopeuttaminen, koska uskon, että se on tekijä, joka parantaa eniten elämänlaatua.
Srinivas Narayanan: Rajapinta, jonka kautta olemme tekoälyn kanssa vuorovaikutuksessa, muuttuu perusteellisesti. Tekoälystä tulee entistä itsenäisempi, ja se käsittelee jatkuvasti monimutkaisia tehtäviä ja tavoitteita puolestamme taustalla.
He ottavat meihin yhteyttä vain tarvittaessa. Robotiikan pitäisi myös olla niin kehittynyttä, että se pystyy suorittamaan meille hyödyllisiä tehtäviä reaalimaailmassa. (Tämän vastauksen perusteella tekoälyagentti on todellakin yksi AGI:n parhaista käyttötapauksista.)
Kehittyneiden äänikeskusteluominaisuuksien määrä on ilmeisesti vähentynyt sen jälkeen, kun video-ominaisuus julkaistiin. Onko suunnitelmia tämän korjaamiseksi tai parantamiseksi?
Srinivas Narayanan: Shranin Sara: Kiitos palautteesta, otamme asian huomioon.
Miksi tietojen toimittamisen määräaika on o3 - mini vielä lokakuussa 2023? Koskeeko tämä myös o3:a tai o3 Prota? Onko suunnitelmissa päivittää tiedon määräaikaa?
Ennen kuin maksoin Plus-tilauksen, GPT-4o:n tietojen määräaika oli kesäkuu 2024, mutta nyt kun olen maksanut, tietojen määräaika on siirtynyt takaisin lokakuuhun 2023. Miksi näin on?
Sam Altman: Nyt kun olemme ottaneet haun käyttöön, tämä (tiedon vanhentumispäivä) on vähemmän tärkeä. Henkilökohtaisesti en enää koskaan ajattele tiedon vanhenemispäivää.
Mitä muita tekoälyagentteja voimme odottaa?
Luo agentti myös ilmaiskäyttäjille nopeuttaaksesi käyttöönottoa.
Onko DALL-E:n uudesta versiosta kuulunut mitään uutta?
Ja lopuksi kysymys, jonka kaikki kysyvät: milloin AGI saavutetaan?
Kevin Weil: Kevin Weil: Lisää agentteja julkaistaan pian, ja uskon, että olet tyytyväinen niihin. 4o:een perustuva kuvasukupolvi on noin muutaman kuukauden päässä, enkä malta odottaa, että pääsen näyttämään sitä teille. Se on todella hieno.
AGI toteutuu.
Tuleeko GPT-4o:hon suuria parannuksia? Pidän todella paljon mukautetusta GPT:stä, ja olisi hienoa, jos sitä voitaisiin päivittää tai jos voisimme valita, mitä mallia käytämme mukautetussa GPT:ssä (esim. o3 mini).
Michelle Pokrass: Pokrass: Kyllä, emme ole vielä lopettaneet 4o-sarjaa!
Tuleeko kehittyneeseen äänitilaan päivitys? Onko tämä yksi GPT-5o:n painopisteistä?
Sam Altman: Kyllä, kehittyneeseen äänitilaan tulee päivitys!
Kutsumme sitä GPT-5:ksi, emme GPT-5o:ksi. Aikataulua ei ole vielä olemassa.
Kuinka tärkeää Stargaten menestys oli OpenAI:n tulevaisuudelle?
Kevin Weil: Kevin Weil: Erittäin tärkeää. Kaikki näkemämme viittaa siihen, että mitä enemmän laskentatehoa meillä on, sitä parempia malleja voimme rakentaa ja sitä arvokkaampia tuotteita voimme luoda. Olemme nyt skaalaamassa malleja kahdella ulottuvuudella samanaikaisesti - suuremmalla esiharjoittelulla ja vahvistusoppimisella (RL) / "mansikalla" (luultavasti jonkinlainen teknologia- tai hankekoodinimi) - ja molemmat vaativat laskentatehoa.
Niin on myös tuotteiden toimittaminen sadoille miljoonille käyttäjille! Ja se vaatii laskentatehoa, kun siirrymme kohti älykkäämpiä tuotteita, jotka voivat toimia käyttäjien hyväksi jatkuvasti. Ajattele Stargatea tehtaana, joka muuttaa sähkön tai GPU:t loistaviksi tuotteiksi.