DeepSeek on tehnyt sen! OpenAI myöntää suljetun lähdekoodin virheen, etumatka pienenee

Jälkeen OpenAI julkaisi o3-mini-mallin, sen toimitusjohtaja Sam Altman, tutkimusjohtaja Mark Chen ja tuotejohtaja Kevin Weil;

Tekniikan johtaja Srinivas Narayanan, API-tutkimuksen johtaja Michelle Pokrass ja tutkimuspäällikkö Hongyu Ren suorittivat teknisen verkkokyselyn ja -vastauksen redditissä, joka on yksi maailman suurimmista kattavista foorumeista.

Tärkeimmät keskustelunaiheet olivat OpenAI:n nykytilanne, tuleva tuotesuunnittelu ja suuren DeepSeek-R1-mallin maailmanlaajuinen ilmiö.

Parhaat kysymykset

Eräs käyttäjä kysyi: "Voimmeko nähdä kaikki suuren mallin ajattelumerkit?"

Sam Altman: "Kyllä, näytämme pian hyödyllisemmän ja yksityiskohtaisemman version. Tämä johtuu päivityksestä osoitteessa R1.

Kevin Weil: Tämä tapahtuu pian. Tarkka tapa näyttää kaikki sisältö on vielä määrittelemättä, mutta kaikkien ajatusketjujen näyttäminen voisi johtaa kilpailulliseen hienosäätöön.

Tiedämme kuitenkin myös, että ihmiset (ainakin tehokäyttäjät) haluavat nähdä tämän, joten löydämme oikean tavan tasapainottaa tämä.

Srinivas Narayanan: Sara Narrinivas: Etsimme keinoja näyttää enemmän ajatuksen kulkua. Pysy kuulolla.

Voisitteko harkita mallipainojen julkaisemista ja tutkimusten julkaisemista?

Sam Altman: Kyllä, keskustelemme siitä. Luulen, että olemme valinneet historiallisesti väärän puolen suljetun lähdekoodin ja että meidän on keksittävä erilainen avoimen lähdekoodin strategia. Kaikki eivät ole tätä mieltä, eikä se ole tällä hetkellä ensisijainen tavoitteemme.

Puhutaanpa tämän viikon kuumasta aiheesta, Deepseekistä. Tämä on tietenkin erittäin vaikuttava malli, ja tiedän, että se on luultavasti koulutettu muiden suurten mallien tuotosten perusteella. Miten tämä vaikuttaa tuleviin mallisuunnitelmiinne?

Sam Altman: Se on erittäin hyvä malli! Kehitämme parempia malleja, mutta etumatka on pienempi kuin aiempina vuosina.

Oletetaan, että eletään vuotta 2030 ja olet juuri luonut yleisen tekoälyjärjestelmän (AGI). Se on erinomainen kaikissa asettamissasi vertailuarvoissa ja päihittää parhaat insinöörisi ja tutkijasi sekä nopeudessa että suorituskyvyssä. Mitä seuraavaksi? Onko muita suunnitelmia kuin "julkaise se verkkosivustolla"?

Sam Altman: Tärkein vaikutus on mielestäni tieteellisten keksintöjen nopeuttaminen, koska uskon, että se on tekijä, joka parantaa eniten elämänlaatua.

Srinivas Narayanan: Rajapinta, jonka kautta olemme tekoälyn kanssa vuorovaikutuksessa, muuttuu perusteellisesti. Tekoälystä tulee entistä itsenäisempi, ja se käsittelee jatkuvasti monimutkaisia tehtäviä ja tavoitteita puolestamme taustalla.

He ottavat meihin yhteyttä vain tarvittaessa. Robotiikan pitäisi myös olla niin kehittynyttä, että se pystyy suorittamaan meille hyödyllisiä tehtäviä reaalimaailmassa. (Tämän vastauksen perusteella tekoälyagentti on todellakin yksi AGI:n parhaista käyttötapauksista.)

Kehittyneiden äänikeskusteluominaisuuksien määrä on ilmeisesti vähentynyt sen jälkeen, kun video-ominaisuus julkaistiin. Onko suunnitelmia tämän korjaamiseksi tai parantamiseksi?

Srinivas Narayanan: Shranin Sara: Kiitos palautteesta, otamme asian huomioon.

Miksi tietojen toimittamisen määräaika on o3 - mini vielä lokakuussa 2023? Koskeeko tämä myös o3:a tai o3 Prota? Onko suunnitelmissa päivittää tiedon määräaikaa?

Ennen kuin maksoin Plus-tilauksen, GPT-4o:n tietojen määräaika oli kesäkuu 2024, mutta nyt kun olen maksanut, tietojen määräaika on siirtynyt takaisin lokakuuhun 2023. Miksi näin on?

Sam Altman: Nyt kun olemme ottaneet haun käyttöön, tämä (tiedon vanhentumispäivä) on vähemmän tärkeä. Henkilökohtaisesti en enää koskaan ajattele tiedon vanhenemispäivää.

Mitä muita tekoälyagentteja voimme odottaa?

Luo agentti myös ilmaiskäyttäjille nopeuttaaksesi käyttöönottoa.

Onko DALL-E:n uudesta versiosta kuulunut mitään uutta?

Ja lopuksi kysymys, jonka kaikki kysyvät: milloin AGI saavutetaan?

Kevin Weil: Kevin Weil: Lisää agentteja julkaistaan pian, ja uskon, että olet tyytyväinen niihin. 4o:een perustuva kuvasukupolvi on noin muutaman kuukauden päässä, enkä malta odottaa, että pääsen näyttämään sitä teille. Se on todella hieno.

AGI toteutuu.

Tuleeko GPT-4o:hon suuria parannuksia? Pidän todella paljon mukautetusta GPT:stä, ja olisi hienoa, jos sitä voitaisiin päivittää tai jos voisimme valita, mitä mallia käytämme mukautetussa GPT:ssä (esim. o3 mini).

Michelle Pokrass: Pokrass: Kyllä, emme ole vielä lopettaneet 4o-sarjaa!

Tuleeko kehittyneeseen äänitilaan päivitys? Onko tämä yksi GPT-5o:n painopisteistä?

Sam Altman: Kyllä, kehittyneeseen äänitilaan tulee päivitys!

Kutsumme sitä GPT-5:ksi, emme GPT-5o:ksi. Aikataulua ei ole vielä olemassa.

Kuinka tärkeää Stargaten menestys oli OpenAI:n tulevaisuudelle?

Kevin Weil: Kevin Weil: Erittäin tärkeää. Kaikki näkemämme viittaa siihen, että mitä enemmän laskentatehoa meillä on, sitä parempia malleja voimme rakentaa ja sitä arvokkaampia tuotteita voimme luoda. Olemme nyt skaalaamassa malleja kahdella ulottuvuudella samanaikaisesti - suuremmalla esiharjoittelulla ja vahvistusoppimisella (RL) / "mansikalla" (luultavasti jonkinlainen teknologia- tai hankekoodinimi) - ja molemmat vaativat laskentatehoa.

Niin on myös tuotteiden toimittaminen sadoille miljoonille käyttäjille! Ja se vaatii laskentatehoa, kun siirrymme kohti älykkäämpiä tuotteita, jotka voivat toimia käyttäjien hyväksi jatkuvasti. Ajattele Stargatea tehtaana, joka muuttaa sähkön tai GPU:t loistaviksi tuotteiksi.

Samankaltaisia viestejä

Uncategorized

Qwen2.5-max vs DeepSeek R1: syvällinen mallien vertailu: täydellinen analyysi sovellusskenaarioista

Byzddeepseeker helmikuuta 14, 2025helmikuuta 14, 2025

Johdanto Nykyään suurilla kielimalleilla (LLM) on ratkaiseva rooli. Vuoden 2025 alussa, kun kilpailu tekoälystä kiristyi, Alibaba lanseerasi uuden Qwen2.5-max AI -mallin ja DeepSeek, Hangzhoussa Kiinassa, lanseerasi R1-mallin, joka edustaa LLM-teknologian huippua. Deepseek R1 on avoimen lähdekoodin tekoälymalli, joka on houkutellut…

Uncategorized

Miten DeepSeek luotiin? Analyysi DeepSeek:n kasvuhistoriasta

Byzddeepseeker helmikuu 3, 2025helmikuu 3, 2025

Tulevaisuudessa kovan luokan innovaatiot tulevat lisääntymään. Sitä ei ehkä ole helppo ymmärtää nyt, koska koko yhteiskuntaryhmää on koulutettava tosiasioilla. Kun tämä yhteiskunta antaa hardcore-innovaatioita tekevien ihmisten menestyä, kollektiivinen ajattelutapa muuttuu. Tarvitsemme vain kasan faktoja ja prosessin.....

Uncategorized

Gemini 2.0 hallitsee listoja, kun taas DeepSeek V3 huutaa hinnassaan, ja uusi kustannustehokas mestari on syntynyt!

Byzddeepseeker helmikuuta 8.2025helmikuuta 8.2025

Google Gemini 2.0 -perhe on vihdoin valmis! Se hallitsee listoja heti julkaisun jälkeen. Keskellä Deepseekin, Qwenin ja o3:n tavoittelua ja estoja Google julkaisi kolme mallia kerralla aikaisin tänä aamuna: Gemini 2.0 Pro, Gemini 2.0 Flash ja Gemini 2.0 Flash-Lite. Suurissa LMSYS-malleissa Gemini…

Uncategorized

Googlen halpamalli, Gemini 2.0 -sarja, hyökkää: taistelu suurten mallien kustannustehokkuudesta kiihtyy.

Byzddeepseeker helmikuuta 8.2025helmikuuta 8.2025

Suurten tekoälymallien käytön korkeat kustannukset ovat suuri syy siihen, miksi monia tekoälysovelluksia ei ole vielä otettu käyttöön ja mainostettu. Äärimmäisen suorituskyvyn valitseminen merkitsee valtavia laskentatehokustannuksia, mikä johtaa korkeisiin käyttökustannuksiin, joita tavalliset käyttäjät eivät voi hyväksyä. Kilpailu suurista tekoälymalleista on kuin sotaa ilman savua. Jälkeen…

Uncategorized

DeepSeek-R1-tekniikka paljastettiin: paperin perusperiaatteet murretaan ja avain läpimurtomallin suorituskykyyn paljastuu

Byzddeepseeker helmikuuta 9.2025helmikuuta 9.2025

Tänään jaamme DeepSeek R1:n, Otsikko: DeepSeek-R1: Päättelykyvyn kannustaminen LLM:issä vahvistusoppimisen avulla: LLM:n päättelykyvyn kannustaminen vahvistusoppimisen avulla. Tässä artikkelissa esitellään DeepSeek:n ensimmäisen sukupolven päättelymallit, DeepSeek-R1-Zero ja DeepSeek-R1. DeepSeek-R1-Zero-mallia koulutettiin laajamittaisella vahvistusoppimisella (RL) ilman valvottua hienosäätöä (SFT) alkuvaiheessa,…

Uncategorized

Le Chat on listan kärjessä sadan miljardin dollarin sijoituksella. Onko se kolmas tekoälyvoima Yhdysvaltojen ja Kiinan jälkeen?

Byzddeepseeker helmikuuta 11, 2025helmikuuta 11, 2025

Ranskan presidentti Emmanuel Macron ilmoitti 9. helmikuuta, että Ranska sijoittaa 109 miljardia euroa (113 miljardia dollaria) tekoälyn alaan lähivuosina. Tällä investoinnilla rakennetaan tekoälypuisto Ranskaan, parannetaan infrastruktuuria ja investoidaan paikallisiin tekoälyn startupeihin. Samaan aikaan Mistral, ranskalainen startup,…

DeepSeek on tehnyt sen! OpenAI myöntää suljetun lähdekoodin virheen, etulyöntiasema etu pienenee

Parhaat kysymykset

Qwen2.5-max vs DeepSeek R1: syvällinen mallien vertailu: täydellinen analyysi sovellusskenaarioista

Miten DeepSeek luotiin? Analyysi DeepSeek:n kasvuhistoriasta

Gemini 2.0 hallitsee listoja, kun taas DeepSeek V3 huutaa hinnassaan, ja uusi kustannustehokas mestari on syntynyt!

Googlen halpamalli, Gemini 2.0 -sarja, hyökkää: taistelu suurten mallien kustannustehokkuudesta kiihtyy.

DeepSeek-R1-tekniikka paljastettiin: paperin perusperiaatteet murretaan ja avain läpimurtomallin suorituskykyyn paljastuu

Le Chat on listan kärjessä sadan miljardin dollarin sijoituksella. Onko se kolmas tekoälyvoima Yhdysvaltojen ja Kiinan jälkeen?

Vastaa Peruuta vastaus