Viime viikolla DeepSeek ilmoitti avaavansa viisi projektia ensi viikolla: Netizens sanoi: "Tällä kertaa OpenAI on todella täällä." Juuri nyt tuli ensimmäinen avoimen lähdekoodin projekti, joka liittyy päättelykiihtyvyyteen, FlashMLA: Avoimen lähdekoodin projektin osoite: DeepSeek FlashMLA Se on ollut avoimen lähdekoodin kaksi tuntia, ja Githubilla on jo 2,7k+ tähteä: The…
FlashMLA on nopeasti saanut huomiota tekoälyn maailmassa, erityisesti suurten kielimallien (LLM) alalla. Tämä DeepSeek:n kehittämä innovatiivinen työkalu toimii optimoidun dekoodausytimenä, joka on suunniteltu Hopperin GPU:ille – korkean suorituskyvyn siruille, joita käytetään yleisesti tekoälylaskelmissa. FlashMLA keskittyy vaihtuvan pituisten sekvenssien tehokkaaseen käsittelyyn, mikä tekee siitä erityisen hyvin…
Johdanto Nykyään suurilla kielimalleilla (LLM) on ratkaiseva rooli. Vuoden 2025 alussa, kun kilpailu tekoälystä kiristyi, Alibaba lanseerasi uuden Qwen2.5-max AI -mallin ja DeepSeek, Hangzhoussa Kiinassa, lanseerasi R1-mallin, joka edustaa LLM-teknologian huippua. Deepseek R1 on avoimen lähdekoodin tekoälymalli, joka on houkutellut…
32B-päättelymalli käyttää vain 1/8 tiedosta ja on sidottu samankokoiseen DeepSeek-R1:een! Juuri nyt laitokset, kuten Stanford, UC Berkeley ja Washingtonin yliopisto, ovat yhdessä julkaisseet SOTA-tason päättelymallin, OpenThinker-32B, ja ovat myös hankkineet avoimen lähdekoodin jopa 114 000 koulutusdataa. OpenThinker Projectin kotisivu: OpenThinker Hugging Face:…