За последние несколько дней Deepseek-R1 0528 был официально открыт исходным кодом. На LiveCodeBench его производительность почти на одном уровне с o3 (high) от OpenAI; в многоязыковом тесте производительности Aider он не уступает Claude Opus. Когда он был запущен на официальном сайте, мы быстро протестировали его возможности front-end и обнаружили, что они исключительно…
Модель DeepSeek R1 подверглась незначительному обновлению версии, текущая версия — DeepSeek-R1-0528. Когда вы входите на веб-страницу или в приложение DeepSeek, включите функцию «Глубокое мышление» в диалоговом интерфейсе, чтобы испытать последнюю версию. Веса модели DeepSeek-R1-0528 были загружены на HuggingFace За последние четыре месяца DeepSeek-R1 подверглась…
На прошлой неделе DeepSeek объявил, что на следующей неделе откроет исходный код пяти проектов: Пользователи сети сказали: «На этот раз OpenAI действительно здесь». Только что появился первый проект с открытым исходным кодом, связанный с ускорением вывода, FlashMLA: Адрес проекта с открытым исходным кодом: DeepSeek FlashMLA Он находится в открытом исходном коде уже два часа, и на Github уже более 2,7 тыс. звезд: The…
FlashMLA быстро привлек внимание в мире искусственного интеллекта, особенно в области больших языковых моделей (LLM). Этот инновационный инструмент, разработанный DeepSeek, служит оптимизированным ядром декодирования, разработанным для Hopper GPU — высокопроизводительных чипов, обычно используемых в вычислениях ИИ. FlashMLA фокусируется на эффективной обработке последовательностей переменной длины, что делает его особенно подходящим…