Miten DeepSeek luotiin? Analyysi DeepSeek:n kasvuhistoriasta

Miten DeepSeek luotiin? Analyysi DeepSeek:n kasvuhistoriasta

Tulevaisuudessa kovan luokan innovaatiot tulevat lisääntymään. Sitä ei ehkä ole helppo ymmärtää nyt, koska koko yhteiskuntaryhmää on koulutettava tosiasioilla. Kun tämä yhteiskunta antaa hardcore-innovaatioita tekevien ihmisten menestyä, kollektiivinen ajattelutapa muuttuu. Tarvitsemme vain kasan faktoja ja prosessin.....

DeepSeek on tehnyt sen! OpenAI myöntää suljetun lähdekoodin virheen, etulyöntiasema etu pienenee

DeepSeek on tehnyt sen! OpenAI myöntää suljetun lähdekoodin virheen, etulyöntiasema etu pienenee

Kun OpenAI julkaisi o3-mini-mallin, sen toimitusjohtaja Sam Altman, tutkimusjohtaja Mark Chen, tuotepäällikkö Kevin Weil, tekninen johtaja Srinivas Narayanan, API-tutkimuksen johtaja Michelle Pokrass ja tutkimusjohtaja Hongyu Ren järjestivät teknisen kyselyn ja vastauksen verkossa redditissä, joka on yksi maailman suurimmista kattavista foorumeista. Tärkeimmät aiheet...

OpenAI o3-mini vs. DeepSeek-R1: Kuka on uuden sukupolven tekoälymallien kuningas?

OpenAI o3-mini vs. DeepSeek-R1: Kuka on uuden sukupolven tekoälymallien kuningas?

o3-mini on täällä haastajan vauhdilla 31. tammikuuta OpenAI julkaisi upouuden o3-mini-suuren mallin ja tarjosi osan sen toiminnoista ilmaiseksi kaikille ChatGPT-käyttäjille. Vaikka kyselyiden määrä on rajoitettu, käyttäjät pääsevät kokemaan OpenAI:n uusimman kaupallisen mallin mahdollisimman pian....

Ensimmäinen laukaisu! SiliconFlow X Huawei Cloud lanseeraavat yhdessä DeepSeek R1- ja V3-vertailupalvelut, jotka perustuvat Ascend Cloudiin!

Ensimmäinen laukaisu! SiliconFlow X Huawei Cloud lanseeraavat yhdessä DeepSeek R1- ja V3-vertailupalvelut, jotka perustuvat Ascend Cloudiin!

DeepSeek-R1 ja DeepSeek-V3 ovat aiheuttaneet maailmanlaajuista kohua avoimen lähdekoodin julkaisunsa jälkeen. Ne ovat DeepSeek-tiimin lahja koko ihmiskunnalle, ja olemme vilpittömästi iloisia niiden menestyksestä. Silicon Mobility- ja Huawei Cloud -tiimien päivien kovan työn jälkeen annamme tänään myös kiinalaisille käyttäjille kiinalaisen...

Kattava vertailu OpenAI:n äskettäin julkaistusta o3-ministä ja DeepSeek R1:stä.

Kattava vertailu OpenAI:n äskettäin julkaistusta o3-ministä ja DeepSeek R1:stä.

OpenAI on julkaissut uusimman päättelymallinsa, o3-mini, joka on optimoitu esimerkiksi luonnontieteiden, matematiikan ja ohjelmoinnin aloille ja joka tarjoaa nopeamman vasteen, suuremman tarkkuuden ja alhaisemmat kustannukset. Edeltäjäänsä o1-miniin verrattuna o3-mini on parantanut merkittävästi päättelyominaisuuksiaan erityisesti monimutkaisten ongelmien ratkaisemisessa. Testaajat suosivat o3-minin vastauksia 56%:llä, ja virheprosentti on...

Tekoälyn piirissä DeepSeek R1 on jatkuvasti ohittanut o1:n ja Clauden fyysisissä testeissä, ja olemme siirtyneet RL:n kulta-aikaan.

Kukaan meistä ei odottanut, että tekoälyalalla alkaisi näin vuosi 2025. DeepSeek R1 on todella hämmästyttävä! Viime aikoina "salaperäinen idän voima" DeepSeek on "kovasti hallinnut" Piilaaksoa. Pyysin R1:tä selittämään Pythagoraan lauseen yksityiskohtaisesti. Tekoäly teki kaiken tämän alle 30 sekunnissa ilman mitään...

Tärkeitä uutisia! OpenAI julkaisi tänään 2 uutta päättelymallia: o3-mini ja o3-mini-high.

Tärkeitä uutisia! OpenAI julkaisi tänään 2 uutta päättelymallia: o3-mini ja o3-mini-high.

o3-mini ja o3-mini (high) julkaistaan tänään. Tavalliset käyttäjät saavat myös o3-minin, ja plus-käyttäjät voivat käyttää o3-mini (high) -versiota. o3-mini (high) on noin 200 pistettä korkeampi kuin o1 Codeforcessa, nopeampi kuin o1 ja suoriutuu paremmin koodauksessa ja matematiikassa, mutta kustannukset ovat edelleen o1-minin tasolla.....

Altman: Olimme väärässä avoimen lähdekoodin tekoälyn suhteen! DeepSeek on tehnyt OpenAI:sta vähemmän edullista, ja seuraava on GPT-5.

Altman: Olimme väärässä avoimen lähdekoodin tekoälyn suhteen! DeepSeek on tehnyt OpenAI:sta vähemmän edullista, ja seuraava on GPT-5.

o3-mini saapui myöhään illalla, ja OpenAI paljasti viimein uusimman valttikorttinsa. Reddit AMA Q&A:n aikana Altman tunnusti syvästi, että hän oli seissyt avoimen lähdekoodin tekoälyn väärällä puolella. Hän sanoi, että avoimen lähdekoodin sisäistä strategiaa harkitaan, ja mallia kehitetään edelleen, mutta...

Paperi-DeepSeek-R1: Päättelykyvyn kannustaminen LLM:ssä vahvistusoppimisen avulla

Tiivistelmä Tässä asiakirjassa esitellään DeepSeek:n ensimmäisen sukupolven päättelymallit: DeepSeek-R1-Zero ja DeepSeek-R1. DeepSeek-R1-Zero, joka on koulutettu laajamittaisen vahvistusoppimisen (RL) avulla ilman valvottua hienosäätöä (SFT), osoittaa huomattavia päättelykykyjä. RL:n avulla se kehittää luonnollisesti tehokkaita päättelykäyttäytymisiä. Sillä on kuitenkin haasteita, kuten huono luettavuus ja kielen sekoittuminen. Näiden ongelmien ratkaisemiseksi ja päättelytehokkuuden parantamiseksi kehitettiin DeepSeek-R1,...