Блог

  • Противостояние четырех лучших моделей! Обзор демонстрирует, насколько мощен Deepseek R1
    За последние несколько дней Deepseek-R1 0528 был официально открыт исходным кодом. На LiveCodeBench его производительность почти на одном уровне с o3 (high) от OpenAI; в многоязыковом тесте производительности Aider он не уступает Claude Opus. Когда он был запущен на официальном сайте, мы быстро протестировали его возможности front-end и обнаружили, что они исключительно…
  • Обновление DeepSeek-R1-0528: более глубокое мышление, более сильное рассуждение
    Модель DeepSeek R1 подверглась незначительному обновлению версии, текущая версия — DeepSeek-R1-0528. Когда вы входите на веб-страницу или в приложение DeepSeek, включите функцию «Глубокое мышление» в диалоговом интерфейсе, чтобы испытать последнюю версию. Веса модели DeepSeek-R1-0528 были загружены на HuggingFace За последние четыре месяца DeepSeek-R1 подверглась…
  • DeepSeek опубликовал свой исходный код, подробное объяснение FlashMLA
    На прошлой неделе DeepSeek объявил, что на следующей неделе откроет исходный код пяти проектов: Пользователи сети сказали: «На этот раз OpenAI действительно здесь». Только что появился первый проект с открытым исходным кодом, связанный с ускорением вывода, FlashMLA: Адрес проекта с открытым исходным кодом: DeepSeek FlashMLA Он находится в открытом исходном коде уже два часа, и на Github уже более 2,7 тыс. звезд: The…
  • Что такое FlashMLA? Подробное руководство по его влиянию на ядра декодирования ИИ
    FlashMLA быстро привлек внимание в мире искусственного интеллекта, особенно в области больших языковых моделей (LLM). Этот инновационный инструмент, разработанный DeepSeek, служит оптимизированным ядром декодирования, разработанным для Hopper GPU — высокопроизводительных чипов, обычно используемых в вычислениях ИИ. FlashMLA фокусируется на эффективной обработке последовательностей переменной длины, что делает его особенно подходящим…

Создайте свой бесплатный аккаунт сегодня!