DeepSeek imetoa msimbo wake wa chanzo, maelezo ya kina ya FlashMLA

Wiki iliyopita, DeepSeek ilitangaza kwamba itafungua chanzo cha miradi mitano wiki ijayo:

Wanamtandao walisema, "Wakati huu, OpenAI iko hapa."

Hivi sasa, mradi wa kwanza wa chanzo wazi ulikuja, unaohusiana na kuongeza kasi ya uelekezaji, FlashMLA:

Fungua anwani ya mradi wa chanzo:

DeepSeek FlashMLA

Imekuwa chanzo wazi kwa saa mbili, na Github tayari ina nyota 2.7k+:

Kazi kuu ya mradi ni:

"FlashMLA ni kernel ya utunzi wa MLA ya Hopper GPU, iliyoboreshwa kwa mlolongo wa urefu tofauti unaotumika."

Ikitafsiriwa, ndivyo:

"FlashMLA ni kernel ya utunzi wa MLA iliyoboreshwa kwa GPU za usanifu wa NVIDIA Hopper, iliyoboreshwa haswa kwa hali za huduma ambazo huchakata mlolongo wa urefu tofauti."

Kwa kifupi:

FlashMLA ni msingi bora wa kusimbua iliyoundwa na DeepInference kwa GPU za usanifu wa Hopper (kama vile H800). Kwa kuboresha hesabu ya usikivu yenye uwezo wa vichwa vingi ya mfuatano wa urefu tofauti, inafanikisha utendakazi wa mwisho wa kipimo data cha 3000GB/s na nguvu ya kompyuta ya 580TFLOPS katika hatua ya kusimbua, kuboresha kwa kiasi kikubwa ufanisi wa hoja na miktadha mirefu kwa miundo mikubwa.

Baadhi ya wanamtandao walisema:

Baadhi ya watu tayari wanaitumia, na wanasema Uhandisi Safi:

Mradi huu ni wa uboreshaji wa uhandisi na kubana utendaji wa maunzi kwa kikomo.

Mradi uko tayari kutumika nje ya boksi.

Mahitaji ya mazingira:

Hopper GPU
CUDA 12.3 na zaidi
PyTorch 2.0 na hapo juu

Mwishoni mwa mradi huo, afisa huyo pia alisema kuwa iliongozwa na miradi ya FlashAttention 2&3 na NVIDIA CUTLASS.

FlashAttention ina uwezo wa kufikia umakinifu wa haraka na wa kumbukumbu, na hutumiwa katika miundo mikubwa ya kawaida. Toleo la hivi punde la kizazi cha tatu linaweza kuongeza kiwango cha utumiaji cha H100 hadi 75%.

Kasi ya mafunzo huongezeka kwa mara 1.5-2, na matokeo ya kimahesabu chini ya FP16 ni ya juu hadi 740 TFLOPs/s, kufikia 75% ya upitishaji wa kinadharia na kutumia kikamilifu rasilimali za kompyuta, ambazo hapo awali zilikuwa 35% pekee.

FlashMLA sio tu kufikia kiwango kikubwa cha utendaji kupitia uboreshaji wa kiwango cha maunzi, lakini pia hutoa suluhisho la nje la kisanduku kwa mazoea ya uhandisi katika uelekezaji wa AI, na kuwa mafanikio muhimu ya kiteknolojia katika kuharakisha uelekezaji wa miundo mikubwa.

Kulikuwa na ufunuo mkubwa kama huo siku ya kwanza.

Natarajia mambo ya programu huria katika siku nne zijazo!

Kama mwana mtandao alisema:

Nyangumi anafanya mawimbi!

DeepSeek ni nzuri!

Isiyowekwa katika kundi

DeepSeek TOP17 Mbadala Bora: Uchambuzi wa Kina (2025)

Na1TP7 Ter Februari 6, 2025Februari 6, 2025

Utangulizi Katika mazingira yanayoendelea kukua kwa kasi ya akili bandia, DeepSeek imeibuka kama modeli yenye nguvu ya lugha. Uchanganuzi huu wa kina unachunguza njia mbadala 17 bora za DeepSeek, ukichunguza vipengele vyake vya kipekee, uwezo na matukio ya matumizi. Utafiti wetu unaangazia majukwaa ya kimataifa na ya Kichina ambayo hutoa ujumuishaji wa DeepSeek au uwezo sawa. Uchambuzi Bora Mbadala 1….

Isiyowekwa katika kundi

Ufafanuzi wa karatasi wa DeepSeek R1 & pointi muhimu za kiufundi

Nazddeepseeker Februari 9, 2025Februari 9, 2025

1 Usuli Wakati wa Tamasha la Majira ya Chini, DeepSeek R1 ilivutia watu wengi tena, na hata makala ya tafsiri ya DeepSeek V3 tuliyoandika hapo awali pia ilisambazwa tena na kujadiliwa sana. Ingawa kumekuwa na uchanganuzi na matoleo mengi ya DeepSeek R1, hapa tumeamua kukusanya vidokezo vinavyolingana vya kusoma. Tutatumia tatu…

Isiyowekwa katika kundi

Altman: Tulikosea kuhusu chanzo wazi cha AI! DeepSeek imefanya OpenAI kuwa na faida kidogo, na inayofuata ni GPT-5

Nazddeepseeker Februari 1, 2025Februari 1, 2025

o3-mini ilifika usiku sana, na OpenAI hatimaye ilifunua kadi yake ya hivi karibuni ya tarumbeta. Wakati wa Maswali na Majibu ya Reddit AMA, Altman alikiri kwa dhati kwamba alikuwa amesimama upande usiofaa wa chanzo wazi cha AI. Alisema kuwa mkakati wa ndani wa chanzo wazi unazingatiwa, na mtindo huo utaendelea kutengenezwa, lakini…

Isiyowekwa katika kundi

Ali Qwen2.5-Max aipita DeepSeek-V3! Mwanamtandao: AI ya Uchina inaziba pengo kwa haraka

Nazddeepseeker Februari 5, 2025Februari 5, 2025

Hivi sasa, mwanamitindo mwingine wa ndani aliongezwa kwenye orodha ya Big Model Arena kutoka kwa Ali, Qwen2.5-Max, ambayo ilipita DeepSeek-V3 na kushika nafasi ya saba katika viwango vya jumla kwa alama 1332. Pia ilipita wanamitindo kama vile Claude 3.5 Sonnet na Llama 3.1 405B kwa kasi moja. Hasa, inafaulu katika upangaji programu…

Isiyowekwa katika kundi

Siri ya DeepSeek 1 | DeepSeekMath na maelezo ya GRPO

Nazddeepseeker Februari 9, 2025Februari 9, 2025

Leo ningependa kushiriki makala kutoka DeepSeek, yenye mada DeepSeekMath: Kusukuma Mipaka ya Kutoa Sababu za Hisabati katika Miundo ya Lugha Huria. Makala haya yanatanguliza DeepSeekMath 7B, ambayo imefunzwa awali kuhusu DeepSeek-Coder-Base-v1.5 7B kulingana na mkusanyiko wa tokeni 120B zinazohusiana na hesabu, lugha asilia na data ya msimbo. Muundo huu ulipata alama ya kushangaza ya 51.7% katika kiwango cha ushindani…

Isiyowekwa katika kundi

Qwen2.5-max vs DeepSeek R1: Ulinganisho wa kina wa mifano: uchambuzi kamili wa hali za matumizi.

Nazddeepseeker Februari 14, 2025Februari 14, 2025

Utangulizi Leo, miundo mikubwa ya lugha (LLMs) ina jukumu muhimu. Mapema 2025, mashindano ya AI yalipozidi, Alibaba ilizindua muundo mpya wa Qwen2.5-max AI, na DeepSeek, kampuni kutoka Hangzhou, Uchina, ilizindua modeli ya R1, ambayo inawakilisha kilele cha teknolojia ya LLM. Deepseek R1 ni mfano wa AI wa chanzo wazi ambao umevutia…

Machapisho Yanayofanana

Toa Jibu Ghairi kujibu