Katika siku chache zilizopita, Deepseek-R1 0528 imefunguliwa rasmi. Kwenye LiveCodeBench, utendakazi wake unakaribia kuwa sawa na OpenAI's o3 (juu); katika jaribio la Aider la lugha nyingi la kuigwa, inashikilia yake dhidi ya Claude Opus. Ilipozinduliwa kwenye tovuti rasmi, tulijaribu haraka uwezo wake wa mwisho na tukapata kuwa ya kipekee…
Muundo wa DeepSeek R1 umepata uboreshaji wa toleo dogo, toleo la sasa likiwa DeepSeek-R1-0528. Unapoingiza ukurasa wa tovuti wa DeepSeek au programu, washa kipengele cha "Kufikiri kwa Kina" katika kiolesura cha mazungumzo ili utumie toleo jipya zaidi. Vipimo vya uzani vya DeepSeek-R1-0528 vimepakiwa kwa HuggingFace Katika kipindi cha miezi minne iliyopita, DeepSeek-R1 imefanyiwa…
Wiki iliyopita, DeepSeek ilitangaza kwamba itafungua chanzo cha miradi mitano wiki ijayo: Wanamtandao walisema, "Wakati huu, OpenAI iko hapa kweli." Hivi sasa, mradi wa kwanza wa chanzo huria ulikuja, unaohusiana na kuongeza kasi ya uelekezaji, FlashMLA: Anwani ya mradi wa chanzo wazi: DeepSeek FlashMLA Imekuwa chanzo wazi kwa saa mbili, na Github tayari ina nyota 2.7k+: The...
FlashMLA imepata usikivu haraka katika ulimwengu wa akili bandia, haswa katika uwanja wa miundo mikubwa ya lugha (LLMs). Zana hii bunifu, iliyotengenezwa na DeepSeek, hutumika kama kerneli ya kusimbua iliyoboreshwa iliyoundwa kwa ajili ya Hopper GPUs—chips zenye utendakazi wa hali ya juu zinazotumiwa sana katika hesabu za AI. FlashMLA inaangazia uchakataji mzuri wa mfuatano wa urefu tofauti, na kuifanya iwe ya kufaa sana…