Tekoälyn piirissä DeepSeek R1 on jatkuvasti ohittanut o1:n ja Clauden fyysisissä testeissä, ja olemme siirtyneet RL:n kulta-aikaan.

Kukaan meistä ei odottanut, että tekoälyalalla alkaisi näin vuosi 2025.

DeepSeek R1 on todella hämmästyttävä!

Viime aikoina "salaperäinen itäinen voima" DeepSeek on "kovasti hallinnut" Piilaaksoa.

Pyysin R1:tä selittämään Pythagoraan lauseen yksityiskohtaisesti. Tekoäly teki kaiken tämän alle 30 sekunnissa ilman virheitä. Lyhyesti sanottuna, se on ohi.

Kotimaisissa ja ulkomaisissa tekoälypiireissä tavalliset nettikansalaiset ovat havainneet hämmästyttävän ja tehokkaan uuden tekoälyn (joka on myös avointa lähdekoodia), ja akateemiset asiantuntijat ovat huutaneet, että "meidän on saatava heidät kiinni". On myös kuultu, että ulkomaiset tekoälyyritykset ovat jo suuressa vaarassa.

Otetaan esimerkiksi tämä tällä viikolla julkaistu DeepSeek R1. Sen puhdas vahvistusoppimisreitti ilman valvottua harjoittelua on järkyttävä. Deepseek-v3-pohjan viime vuoden joulukuussa tapahtuneesta kehittämisestä nykyisiin OpenAI o1:een verrattaviin ajatteluketjun kykyihin näyttää olevan vain ajan kysymys.

Mutta vaikka tekoälyyhteisö lukee kiireisesti teknisiä raportteja ja vertailee todellisia mittauksia, ihmiset epäilevät edelleen R1:ää: sen lisäksi, että se pystyy päihittämään joukon vertailuarvoja, voiko se todella johtaa?

Sisällysluettelo

Voiko se rakentaa omia simulaatioitaan "fysikaalisista laeista"?

Etkö usko sitä? Annetaan ison mallin leikkiä flipperillä?

Viime päivinä joistakin tekoälyyhteisön ihmisistä on tullut pakkomielle testistä - erilaisten tekoälyn suurten mallien (erityisesti niin sanottujen päättelymallien) testaamisesta ongelman ratkaisemiseksi: "Kirjoita Python-skripti, joka saa keltaisen pallon pomppimaan tietyn muodon sisällä. Laita muoto pyörimään hitaasti ja varmista, että pallo pysyy muodon sisällä.".

Jotkin mallit päihittävät toiset tässä "pyörivän pallon" vertailussa. CoreViewin teknologiajohtaja Ivan Fioravantin mukaan kotimaisella tekoälylaboratoriolla DeepSeek on avoimen lähdekoodin suuri malli R1, joka voittaa OpenAI:n o1 pro -mallin, joka maksaa $200 kuukaudessa osana OpenAI:n ChatGPT Pro -ohjelmaa.

Vasemmalla on OpenAI o1 ja oikealla DeepSeek R1. Kuten edellä mainittiin, kehote on: "kirjoita python-skripti pomppivalle keltaiselle pallolle neliön sisällä, varmista, että käsittelet törmäystunnistuksen oikein. tee neliö hitaasti pyörimään. toteuta se pythonilla. varmista, että pallo pysyy neliön sisällä.".

Toisen X-käyttäjän mukaan Anthropic Claude 3.5 Sonnet ja Googlen Gemini 1.5 Pro -mallit tekivät virheellisiä arvioita fysikaalisista periaatteista, mikä aiheutti pallon poikkeamisen muodosta. Jotkut käyttäjät ovat myös kertoneet, että Googlen uusin Gemini 2.0 Flash Thinking Experimental sekä suhteellisen vanhempi OpenAI GPT-4o läpäisivät arvioinnin kerralla.

Mutta on olemassa tapa erottaa tämä toisistaan:

Netizens tämän twiitin alla sanoi: o1: n kyky oli alun perin erittäin hyvä, mutta se heikentyi OpenAI: n optimoidun nopeuden jälkeen, jopa $200 / kuukausi jäsenyysversiolla.

Pomppivan pallon simulointi on klassinen ohjelmointihaaste. Tarkassa simuloinnissa yhdistyvät törmäystunnistusalgoritmit, joiden on tunnistettava, milloin kaksi kohdetta (kuten pallo ja muodon sivu) törmäävät toisiinsa. Väärin kirjoitettu algoritmi voi vaikuttaa simulaation suorituskykyyn tai aiheuttaa ilmeisiä fysikaalisia virheitä.

Nous Research -nimisen tekoälyalan startup-yrityksen tutkija N8 Programs kertoi, että häneltä kesti noin kaksi tuntia kirjoittaa tyhjästä pomppiva pallo pyörivään heptagoniin. "Useita koordinaattijärjestelmiä on seurattava, tarvitaan ymmärrystä siitä, miten törmäykset käsitellään kussakin järjestelmässä, ja koodi on suunniteltava alusta alkaen, jotta se olisi vankka."

Vaikka pomppivat pallot ja pyörivät muodot ovat kohtuullinen testi ohjelmointitaidoille, ne ovat kuitenkin uusia projekteja suurille malleille, ja pienetkin muutokset kehotuksissa voivat tuottaa erilaisia tuloksia. Jos siitä siis aiotaan lopulta tehdä osa suurten tekoälymallien vertailutestiä, sitä on vielä parannettava.

Joka tapauksessa tämän käytännön testien aallon jälkeen meillä on käsitys suurten mallien ominaisuuksien eroista.

DeepSeek on uusi "Piilaakson myytti".

DeepSeek aiheuttaa paniikkia" kaikkialla Tyynellämerellä.

Metan työntekijät ovat kirjoittaneet, että "Metan insinöörit analysoivat kuumeisesti DeepSeek:tä ja yrittävät kopioida siitä kaiken mahdollisen".

Alexandr Wang, tekoälyteknologia-alan startup-yrityksen Scale AI:n perustaja, totesi myös julkisesti, että DeepSeek:n tekoälyn suuren mallin suorituskyky vastaa suunnilleen Yhdysvaltojen parasta mallia.

Hän uskoo myös, että Yhdysvallat on saattanut olla tekoälykilpailussa Kiinaa edellä viime vuosikymmenen aikana, mutta DeepSeek:n julkaisema suuri tekoälymalli voi "muuttaa kaiken".

X Bloggaaja @8teAPi uskoo, että DeepSeek ei ole "sivuprojekti", vaan se on kuin Lockheed Martinin entinen "Skunk Works".

Niin sanottu "Skunk Works" tarkoittaa erittäin luottamuksellista, suhteellisen itsenäistä pientä ryhmää, jonka Lockheed Martin perusti alun perin kehittämään monia kehittyneitä lentokoneita ja joka harjoitti huipputeknologian tai epätavanomaisen teknologian tutkimusta ja kehittämistä. U-2-tiedustelulentokoneesta ja SR-71 Blackbirdistä F-22 Raptoriin ja F-35 Lightning II -hävittäjään - ne kaikki ovat lähtöisin täältä.

Myöhemmin termi kehittyi vähitellen yleisnimitykseksi, jota käytettiin kuvaamaan "pieniä mutta hienoja", suhteellisen itsenäisiä ja joustavampia innovaatiotiimejä, jotka perustettiin suuriin yrityksiin tai organisaatioihin.

Hän esitti kaksi syytä:

Toisaalta DeepSeek:ssä on suuri määrä näytönohjaimia, tiettävästi yli 10 000, ja Scale AI:n toimitusjohtaja Alexandr Wang sanoi jopa, että määrä voi nousta 50 000:een.
Toisaalta DeepSeek rekrytoi lahjakkuuksia vain Kiinan kolmesta parhaasta yliopistosta, mikä tarkoittaa, että DeepSeek on yhtä kilpailukykyinen kuin Alibaba ja Tencent.

Jo nämä kaksi seikkaa osoittavat, että DeepSeek on selvästi saavuttanut kaupallista menestystä ja että se on riittävän tunnettu saadakseen nämä varat.

DeepSeek:n kehityskustannuksista bloggaaja totesi, että kiinalaiset teknologiayritykset voivat saada erilaisia tukia, kuten alhaiset sähkökustannukset ja maankäyttö.

Näin ollen on hyvin todennäköistä, että suurin osa DeepSeek:n kustannuksista on "sijoitettu" ydinliiketoiminnan ulkopuoliselle tilille tai jonkinlaisena datakeskuksen rakentamiseen myönnettävänä tukena.

Perustajia lukuun ottamatta kukaan ei ymmärrä täysin kaikkia rahoitusjärjestelyjä. Jotkin sopimukset saattavat olla pelkkiä "suullisia sopimuksia", jotka tehdään pelkän maineen perusteella.

Muutama asia on kuitenkin selvää:

Malli on erinomainen, verrattavissa OpenAI:n kaksi kuukautta sitten julkaisemaan versioon, ja on tietysti mahdollista, että se ei ole yhtä hyvä kuin uudet mallit, joita OpenAI ja Anthropic eivät ole vielä julkaisseet.
Nykynäkökulmasta katsottuna tutkimussuunta on edelleen amerikkalaisten yritysten hallitsema. DeepSeek-malli on "nopea jatko" o1-versiolle, mutta DeepSeek:n tutkimus- ja kehitystyön edistyminen on erittäin nopeaa, ja se saavuttaa odotettua nopeammin. He eivät plagioi tai huijaa, korkeintaan he tekevät käänteistä suunnittelua.
DeepSeek kouluttaa pääasiassa omia lahjakkuuksiaan sen sijaan, että se turvautuisi amerikkalaisiin tohtoreihin, mikä laajentaa lahjakkuuksien joukkoa huomattavasti.
Yhdysvaltalaisiin yrityksiin verrattuna DeepSeek:hen kohdistuu vähemmän rajoituksia teollis- ja tekijänoikeuksien lisensoinnin, yksityisyyden suojan, turvallisuuden, politiikan jne. suhteen, ja huoli sellaisten tietojen väärinkäytöstä, joita ihmiset eivät halua koulutettavan, on pienempi. On vähemmän oikeusjuttuja, vähemmän asianajajia ja vähemmän huolenaiheita.

Yhä useammat uskovat epäilemättä, että vuosi 2025 on ratkaiseva vuosi. Sillä välin yritykset valmistautuvat siihen. Esimerkiksi Meta rakentaa yli 2 GW:n datakeskusta, jonka investoinnit ovat arviolta $60-65 miljardia euroa vuoteen 2025 mennessä, ja sillä on vuoden loppuun mennessä yli 1,3 miljoonaa näytönohjainta.

Meta käytti jopa taulukkoa vertaillakseen 2 gigawatin datakeskustaan New Yorkin Manhattaniin.

Mutta nyt DeepSeek on onnistunut paremmin alhaisemmilla kustannuksilla ja vähemmillä näytönohjaimilla. Miten tämä ei voi saada ihmisiä ahdistumaan?

Yann LeCun: Meidän on kiitettävä teknologiapäällikköä ja yrityksen ... avoin lähdekoodi

Hyperbolinen, Yuchen Jin, siitä, että DeepSeek-R1 on osoittanut meille neljä tosiasiaa vain neljässä päivässä:

Avoimen lähdekoodin tekoäly on vain 6 kuukautta suljetun lähdekoodin tekoälyä jäljessä.
Kiina hallitsee avoimen lähdekoodin tekoälykilpailua
Olemme siirtymässä suurten kielimallien vahvistusoppimisen kulta-aikaan.
Tislausmallit ovat erittäin tehokkaita, ja me tulemme käyttämään erittäin älykästä tekoälyä matkapuhelimissa.

DeepSeek:n käynnistämä ketjureaktio jatkuu edelleen, kuten OpenAI:n o3-minin asettaminen vapaasti saataville, yhteisön toive vähentää epämääräisiä keskusteluja AGI:stä/ASI:sta ja huhu, jonka mukaan Meta on paniikissa.

Hänen mielestään on vaikea ennustaa, kuka lopulta voittaa, mutta meidän ei pidä unohtaa myöhäisen tulokkaan etulyöntiaseman voimaa. Loppujen lopuksi me kaikki tiedämme, että Google keksi Transformerin, kun taas OpenAI avasi sen todellisen potentiaalin.

Lisäksi Turing-palkinnon voittaja ja Metan johtava tekoälytieteilijä Yann LeCun esitti näkemyksensä.

"Ne, jotka DeepSeek:n suorituskyvyn nähtyään ajattelevat, että Kiina on ohittamassa Yhdysvallat tekoälyn alalla, ovat väärässä. Oikea käsitys on, että avoimen lähdekoodin mallit ovat ohittamassa proprietääriset mallit.""

LeCun sanoi, että DeepSeek on tällä kertaa tehnyt niin suuren vaikutuksen, koska se on hyötynyt avoimesta tutkimuksesta ja avoimesta lähdekoodista (kuten Metan PyTorch ja Llama). DeepSeek on keksinyt uusia ideoita ja rakentanut muiden työn varaan. Koska heidän työnsä on julkista ja avointa lähdekoodia, kaikki voivat hyötyä siitä. Tämä on avoimen tutkimuksen ja avoimen lähdekoodin voima.

Nettikansalaisten pohdinnat jatkuvat. Vaikka he ovat innoissaan uusien teknologioiden kehityksestä, he voivat myös tuntea pientä ahdistusta. Loppujen lopuksi DeepSeekersin ilmaantumisella voi olla todellisia vaikutuksia.

Tekoälyn piirissä DeepSeek R1 on jatkuvasti ohittanut o1:n ja Clauden fyysisissä testeissä, ja olemme siirtyneet RL:n kulta-aikaan.

Voiko se rakentaa omia simulaatioitaan "fysikaalisista laeista"?

DeepSeek on uusi "Piilaakson myytti".

Yann LeCun: Meidän on kiitettävä teknologiapäällikköä ja yrityksen ... avoin lähdekoodi

Äärimmäisiä uutisia! DeepSeek-tutkija paljastaa verkossa: R1-koulutus kesti vain kahdesta kolmeen viikkoa, ja R1-nollan voimakas kehitys havaittiin kiinalaisen uudenvuoden loman aikana

DeepSeek R1 tuli ensimmäiseksi luovan kirjoittamisen kokeessa, ja o3 mini oli jopa huonompi kuin o1 mini!

Miten DeepSeek luotiin? Analyysi DeepSeek:n kasvuhistoriasta

DeepSeek on julkaissut lähdekoodinsa, yksityiskohtaisen selvityksen FlashMLA:sta

DeepSeek on tehnyt sen! OpenAI myöntää suljetun lähdekoodin virheen, etulyöntiasema etu pienenee

Google on julkaissut kolme uutta mallia kerralla: Gemini-2.0-Pro on ilmainen, sillä on erinomaiset pisteet ja ykkössija, ja se sopii monimutkaisten kehotteiden koodaamiseen ja käsittelyyn!

Vastaa Peruuta vastaus

Voiko se rakentaa omia simulaatioitaan "fysikaalisista laeista"?

DeepSeek on uusi "Piilaakson myytti".

Yann LeCun: Meidän on kiitettävä teknologiapäällikköä ja yrityksen ... avoin lähdekoodi

Samankaltaisia viestejä

Vastaa Peruuta vastaus