Viime päivinä Deepseek-R1 0528 on virallisesti julkaistu avoimen lähdekoodin ohjelmistona. LiveCodeBenchissä sen suorituskyky on lähes OpenAI:n o3:n (korkea) tasolla; Aiderin monikielisessä vertailutestissä se pärjää Claude Opusin rinnalla. Kun se julkaistiin virallisella verkkosivustolla, testasimme nopeasti sen käyttöliittymän ominaisuuksia ja havaitsimme niiden olevan poikkeuksellisen…
DeepSeek R1-malliin on tehty pieni päivitys, ja nykyinen versio on DeepSeek-R1-0528. Kun siirryt DeepSeek-verkkosivulle tai -sovellukseen, ota käyttöön "Deep Thinking" -ominaisuus valintaikkunassa kokeaksesi uusimman version. DeepSeek-R1-0528-mallin painot on ladattu HuggingFaceen. Viimeisten neljän kuukauden aikana DeepSeek-R1 on kokenut…
Viime viikolla DeepSeek ilmoitti avaavansa viisi projektia ensi viikolla: Netizens sanoi: "Tällä kertaa OpenAI on todella täällä." Juuri nyt tuli ensimmäinen avoimen lähdekoodin projekti, joka liittyy päättelykiihtyvyyteen, FlashMLA: Avoimen lähdekoodin projektin osoite: DeepSeek FlashMLA Se on ollut avoimen lähdekoodin kaksi tuntia, ja Githubilla on jo 2,7k+ tähteä: The…
FlashMLA on nopeasti saanut huomiota tekoälyn maailmassa, erityisesti suurten kielimallien (LLM) alalla. Tämä DeepSeek:n kehittämä innovatiivinen työkalu toimii optimoidun dekoodausytimenä, joka on suunniteltu Hopperin GPU:ille – korkean suorituskyvyn siruille, joita käytetään yleisesti tekoälylaskelmissa. FlashMLA keskittyy vaihtuvan pituisten sekvenssien tehokkaaseen käsittelyyn, mikä tekee siitä erityisen hyvin…