V zadnjih nekaj dneh je bil Deepseek-R1 0528 uradno odprtokoden. Na LiveCodeBench je njegova zmogljivost skoraj na ravni OpenAI-jevega o3 (visoka); v Aiderjevem večjezičnem primerjalnem testu se kosa s Claude Opusom. Ko je bil predstavljen na uradni spletni strani, smo hitro preizkusili njegove zmogljivosti v vmesniku in ugotovili, da so izjemno ...
Model DeepSeek R1 je bil podvržen manjši nadgradnji, trenutna različica je DeepSeek-R1-0528. Ko vstopite na spletno stran ali v aplikacijo DeepSeek, v vmesniku za pogovor omogočite funkcijo »Globoko razmišljanje«, da izkusite najnovejšo različico. Uteži modela DeepSeek-R1-0528 so bile naložene na HuggingFace. V zadnjih štirih mesecih je bil DeepSeek-R1 podvržen…
Prejšnji teden je DeepSeek napovedal, da bo naslednji teden odprtokodno pet projektov: uporabniki interneta so rekli: "Tokrat je OpenAI res tukaj." Pravkar je prišel prvi odprtokodni projekt, povezan s pospeševanjem sklepanja, FlashMLA: naslov odprtokodnega projekta: DeepSeek FlashMLA Odprtokodni je že dve uri, Github pa ima že 2,7k+ zvezdic: The…
FlashMLA je hitro pridobil pozornost v svetu umetne inteligence, zlasti na področju velikih jezikovnih modelov (LLM). To inovativno orodje, ki ga je razvil DeepSeek, služi kot optimizirano jedro za dekodiranje, zasnovano za Hopper GPE-je – visoko zmogljive čipe, ki se običajno uporabljajo v izračunih z umetno inteligenco. FlashMLA se osredotoča na učinkovito obdelavo zaporedij spremenljive dolžine, zaradi česar je še posebej primeren za ...