През последните няколко дни Deepseek-R1 0528 беше официално пуснат в отворен код. В LiveCodeBench производителността му е почти наравно с o3 (високо) на OpenAI; в многоезичния бенчмарк тест на Aider, той се справя добре с Claude Opus. Когато беше пуснат на официалния уебсайт, бързо тествахме възможностите му от предния край и установихме, че те са изключително...
Моделът DeepSeek R1 е претърпял малка актуализация, като текущата версия е DeepSeek-R1-0528. Когато влезете в уеб страницата или приложението на DeepSeek, активирайте функцията „Задълбочено мислене“ в диалоговия интерфейс, за да изпробвате най-новата версия. Теглата на модела DeepSeek-R1-0528 са качени в HuggingFace. През последните четири месеца DeepSeek-R1 е претърпял…
Миналата седмица DeepSeek обяви, че ще отвори пет проекта през следващата седмица: Нетизени казаха: „Този път OpenAI наистина е тук.“ Току-що дойде първият проект с отворен код, свързан с ускоряване на извода, FlashMLA: Адрес на проекта с отворен код: DeepSeek FlashMLA Той е с отворен код от два часа и Github вече има 2,7k+ звезди: The...
FlashMLA бързо привлече вниманието в света на изкуствения интелект, особено в областта на големите езикови модели (LLM). Този иновативен инструмент, разработен от DeepSeek, служи като оптимизирано ядро за декодиране, предназначено за графични процесори Hopper – чипове с висока производителност, често използвани в изчисленията с изкуствен интелект. FlashMLA се фокусира върху ефективната обработка на последователности с променлива дължина, което го прави особено подходящ...