Во текот на изминатите неколку дена, Deepseek-R1 0528 официјално е достапен со отворен код. На LiveCodeBench, неговите перформанси се речиси на исто ниво со o3 на OpenAI (високи); во повеќејазичниот тест на Aider, тој е во конкуренција со Claude Opus. Кога беше лансиран на официјалната веб-страница, брзо ги тестиравме неговите можности за front-end и откривме дека се исклучително...
Моделот DeepSeek R1 претрпе мало надградување на верзијата, при што моменталната верзија е DeepSeek-R1-0528. Кога ќе влезете на веб-страницата или апликацијата DeepSeek, овозможете ја функцијата „Длабоко размислување“ во интерфејсот за дијалог за да ја доживеете најновата верзија. Тежините на моделот DeepSeek-R1-0528 се прикачени на HuggingFace Во текот на изминатите четири месеци, DeepSeek-R1 претрпе…
Минатата недела, DeepSeek објави дека следната недела ќе отвори пет проекти со отворен код: Нетизените рекоа: „Овој пат, OpenAI е навистина тука“. Токму сега, дојде првиот проект со отворен код, поврзан со забрзувањето на заклучоците, FlashMLA: Адреса на проектот со отворен код: DeepSeek FlashMLA Тој е со отворен код веќе два часа, а Github веќе има 2,7k+ ѕвезди: The…
FlashMLA брзо привлече внимание во светот на вештачката интелигенција, особено во областа на големи јазични модели (LLMs). Оваа иновативна алатка, развиена од DeepSeek, служи како оптимизирано јадро за декодирање дизајнирано за графички процесори на Hopper - чипови со високи перформанси кои вообичаено се користат во пресметките со вештачка интелигенција. FlashMLA се фокусира на ефикасна обработка на секвенци со променлива должина, што го прави особено добро прилагоден…