Первый запуск! SiliconFlow X Huawei Cloud совместно запускают сервисы DeepSeek R1 & V3 inference на базе Ascend Cloud!

DeepSeek-R1 и DeepSeek-V3 произвели фурор во всем мире с момента их выхода в свет.

Они - подарок команды DeepSeek всему человечеству, и мы искренне рады их успеху.

После нескольких дней напряженной работы команды Silicon Mobility и Huawei Cloud сегодня мы дарим китайским пользователям подарок на китайский Новый год: крупномасштабная платформа облачных сервисов SiliconCloud запустила DeepSeek-V3 и DeepSeek-R1, которые основаны на облачном сервисе Ascend от Huawei Cloud.

Следует подчеркнуть, что мы получили огромную поддержку от DeepSeek и Huawei Cloud, как в адаптации DeepSeek-R1 & V3 на Ascend, так и в процессе запуска других моделей ранее, и мы хотели бы выразить глубокую благодарность и большое уважение.

Оглавление

Характеристики

Эти две модели, выпущенные SiliconCloud, включают в себя пять основных функций:

На базе облачного сервиса Huawei Cloud Ascend мы запустили DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 впервые предоставила сервис вывода моделей.

Благодаря совместным инновациям двух сторон и поддержке самостоятельно разработанного механизма ускорения вывода, модель DeepSeek, развернутая командой Silicon Mobility на базе облачного сервиса Huawei Cloud Ascend, может достичь того же эффекта, что и модель развертывания GPU высокого класса в мире.

Обеспечение стабильной работы сервисов вывода DeepSeek-R1 и V3 на производственном уровне. Это позволяет разработчикам стабильно работать в крупномасштабных производственных средах и удовлетворять потребности коммерческого развертывания. Сервисы Huawei Cloud Ascend AI предоставляют обильные, эластичные и достаточные вычислительные мощности.

Отсутствует порог развертывания, что позволяет разработчикам больше сосредоточиться на разработке приложений. При разработке приложений они могут напрямую обращаться к API SiliconCloud, что обеспечивает более простой и удобный опыт.

Цена DeepSeek-V3 на SiliconCloud в период официальных скидок (до 24:00 8 февраля) составляет ¥1 / M токенов (вход) и ¥2 / M токенов (выход), а цена DeepSeek-R1 - ¥4 / M токенов (вход) и ¥16 / M токенов (выход).

Опыт работы в Интернете

DeepSeek-R1 с SiliconCloud

DeepSeek-V3 с SiliconCloud

Документация по API

API

Разработчики могут испытать эффект ускорения DeepSeek-R1 & V3 на отечественных чипах на SiliconCloud. Более высокая скорость вывода по-прежнему постоянно оптимизируется.

Опыт работы с клиентскими приложениями

Если вы хотите испытать модель DeepSeek-R1 и V3 непосредственно в клиентском приложении, вы можете установить следующие продукты локально и получить доступ к API SiliconCloud (вы можете настроить и добавить эти две модели), чтобы испытать DeepSeek-R1 и V3.

Большие модели клиентских приложений: ChatBox, Студия "Вишня, OneAPI, LobeChat, NextChat
Приложения для генерации кода: КурсорВиндсерфинг, Клайн
Платформа для разработки приложений больших моделей:Dify
База знаний по искусственному интеллекту:Обсидиановый ИИ, иFastGPT
Плагин для перевода:Immersive Translate иEurodict

Дополнительные руководства по доступу к сценариям и приложениям см. на сайте здесь

Фабрика токенов SiliconCloud

Qwen2.5 (7B) и др. 20+ моделей бесплатно для использования

Как универсальная платформа облачных сервисов для больших моделей, SiliconCloud стремится предоставить разработчикам модельные API, которые являются ультра-отзывчивыми, доступными, всеобъемлющими и имеют шелковисто-гладкий опыт.

Помимо DeepSeek-R1 и DeepSeek-V3, SiliconCloud также выпустила Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

десятки открытых моделей языка, моделей генерации изображений/видео, моделей речи, моделей кода/математики, а также векторных и реорганизационных моделей.

Платформа позволяет разработчикам свободно сравнивать и комбинировать большие модели различных модальностей, чтобы выбрать лучшую практику для вашего приложения генеративного ИИ.

Среди них 20+ API крупных моделей, таких как Qwen2.5 (7B) и Llama3.1 (8B), бесплатны для использования, что позволяет разработчикам и менеджерам продуктов достичь "свободы токенов", не беспокоясь о стоимости вычислительных мощностей на этапе исследований и разработок и масштабного продвижения.

Без категории

Обновление DeepSeek-R1-0528: более глубокое мышление, более сильное рассуждение

Авторzddeepseeker 29 мая 2025 г.29 мая 2025 г.

Модель DeepSeek R1 подверглась незначительному обновлению версии, текущая версия — DeepSeek-R1-0528. Когда вы входите на веб-страницу или в приложение DeepSeek, включите функцию «Глубокое мышление» в диалоговом интерфейсе, чтобы испытать последнюю версию. Веса модели DeepSeek-R1-0528 были загружены на HuggingFace За последние четыре месяца DeepSeek-R1 подверглась…

Без категории

Основные мировые продукты ИИ сосредоточены на анализе и комплексных рекомендациях по пользовательскому опыту (включая DeepSeek и GPT)

Авторzddeepseeker 10 февраля 2025 г.10 февраля 2025 г.

Позиционирование функций и анализ основных преимуществ ChatGPT (OpenAI) — глобальный эталон для универсалов Технические гены ChatGPT: генеративный ИИ на основе серии больших моделей GPT, с общими навыками разговорной речи и логическими рассуждениями в качестве основных преимуществ. Многоязычная обработка: лучше всего работает на английском языке, с постоянным улучшением на китайском языке; но мы рекомендуем использовать английский язык для…

Без категории

Секрет DeepSeek 1 | Подробности DeepSeekMath и GRPO

Авторzddeepseeker 9 февраля 2025 г.9 февраля 2025 г.

Сегодня я хотел бы поделиться статьей из DeepSeek под названием DeepSeekMath: Расширяя границы математического обоснования в моделях открытого языка. В этой статье представлен DeepSeekMath 7B, который предварительно обучен на DeepSeek-Coder-Base-v1.5 7B на основе коллекции из 120B математических токенов, естественного языка и кодовых данных. Модель достигла поразительного результата 51.7% на соревновательном уровне…

Без категории

Раскрыта технология DeepSeek-R1: основные принципы статьи раскрыты и ключ к прорывной производительности модели раскрыт

Авторzddeepseeker 9 февраля 2025 г.9 февраля 2025 г.

Сегодня мы поделимся DeepSeek R1, Название: DeepSeek-R1: Стимулирование способности к рассуждению в LLM посредством обучения с подкреплением: Стимулирование способности к рассуждению в LLM посредством обучения с подкреплением. В этой статье представлено первое поколение моделей рассуждения DeepSeek, DeepSeek-R1-Zero и DeepSeek-R1. Модель DeepSeek-R1-Zero была обучена посредством крупномасштабного обучения с подкреплением (RL) без контролируемой тонкой настройки (SFT) в качестве начального шага,…

Без категории

DeepSeek R1 занял первое место в тесте на креативное письмо, а o3 mini оказался еще хуже, чем o1 mini!

Авторzddeepseeker 3 февраля 2025 года3 февраля 2025 года

DeepSeek R1 завоевал первенство в бенчмарк-тесте на написание творческих рассказов, успешно обойдя предыдущего доминирующего игрока Claude 3.5 Sonnet! Эталонный тест Эталонный тест, разработанный исследователем Лехом Мазуром, не является обычным соревнованием по написанию рассказов. Каждая модель искусственного интеллекта должна была написать 500 коротких рассказов, и в каждом из них нужно было ловко включить...

Без категории

Интерпретация доклада DeepSeek R1 и ключевые технические моменты

Авторzddeepseeker 9 февраля 2025 г.9 февраля 2025 г.

1 Предыстория Во время Весеннего фестиваля DeepSeek R1 снова привлекла всеобщее внимание, и даже статья-интерпретация DeepSeek V3, которую мы ранее написали, также была повторно передана и много обсуждалась. Хотя было много анализов и воспроизведений DeepSeek R1, здесь мы решили собрать некоторые соответствующие заметки для чтения. Мы будем использовать три…

Характеристики

Опыт работы в Интернете

Документация по API

Опыт работы с клиентскими приложениями

Фабрика токенов SiliconCloud

Похожие записи

Добавить комментарий Отменить ответ