
DeepSeek-R1 и DeepSeek-V3 предизвикаха световна сензация след пускането им на пазара с отворен код.
Те са подарък от екипа на DeepSeek за цялото човечество и ние искрено се радваме на техния успех.
След дни на упорита работа от страна на екипите на Silicon Mobility и Huawei Cloud, днес поднасяме на китайските потребители подарък за Китайската нова година: платформата за облачни услуги с широкомащабен модел SiliconCloud пусна на пазара DeepSeek-V3 и DeepSeek-R1, които са базирани на облачната услуга Ascend на Huawei Cloud.
Трябва да се подчертае, че получихме голяма подкрепа от DeepSeek и Huawei Cloud, както при адаптирането на DeepSeek-R1 и V3 на Ascend, така и в процеса на пускане на други модели преди това, и бихме искали да изразим дълбока благодарност и високо уважение.

Характеристики
Тези два модела, лансирани от SiliconCloud, включват основно пет основни функции:
Въз основа на облачната услуга Ascend на Huawei Cloud стартирахме DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 услуга за извеждане на модели за първи път.
Чрез съвместни иновации между двете страни и с подкрепата на самостоятелно разработения двигател за ускоряване на изводите моделът DeepSeek, внедрен от екипа на Silicon Mobility въз основа на облачната услуга Ascend на Huawei Cloud, може да постигне същия ефект като модел за внедряване на графичен процесор от висок клас в света.
Осигуряване на стабилни услуги за изводи на производствено ниво DeepSeek-R1 и V3. Това позволява на разработчиците да работят стабилно в мащабни производствени среди и да отговарят на нуждите на търговското внедряване. Услугите на Huawei Cloud Ascend AI осигуряват изобилна, еластична и достатъчна изчислителна мощност.
Няма праг за внедряване, което позволява на разработчиците да се съсредоточат повече върху разработването на приложения. Когато разработват приложения, те могат директно да извикват API на SiliconCloud, което осигурява по-лесно и по-удобно за потребителя преживяване.
Цената на DeepSeek-V3 в SiliconCloud по време на официалния период на отстъпката (до 24:00 ч. на 8 февруари) е ¥1/М токена (вход) и ¥2/М токена (изход), а цената на DeepSeek-R1 е ¥4/М токена (вход) и ¥16/М токена (изход).

Онлайн опит
DeepSeek-R1 със SiliconCloud
DeepSeek-V3 със SiliconCloud
Документация за API
Разработчиците могат да изпитат ефекта на DeepSeek-R1 и V3, ускорени на местни чипове в SiliconCloud. По-високата изходна скорост все още се оптимизира непрекъснато.


Опит в клиентски приложения
Ако искате да изпитате модела DeepSeek-R1 и V3 директно в клиентското приложение, можете да инсталирате следните продукти локално и да получите достъп до API на SiliconCloud (можете да персонализирате и да добавите тези два модела), за да изпитате DeepSeek-R1 и V3.
- Големи модели клиентски приложения: ChatBox, Студио Cherry, OneAPI, LobeChat, NextChat
- Приложения за генериране на код: Курсор, Уиндсърф, Cline
- Платформа за разработване на приложения за големи модели:Dify
- База с познания за AI:AI на Obsidian, иFastGPT
- Плъгин за превод:Immersive Translate иEurodict
За повече уроци за достъп до сценарии и казуси на приложения, моля, вижте тук
Фабрика за токени SiliconCloud
Qwen2.5 (7B) и др. 20+ модела за свободно ползване
Като платформа за обслужване в облака на едно гише за големи модели, SiliconCloud се ангажира да предоставя на разработчиците API за модели, които са свръхотзивчиви, достъпни, изчерпателни и с копринено гладко изживяване.
В допълнение към DeepSeek-R1 и DeepSeek-V3 SiliconCloud пусна на пазара и Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,
десетки големи езикови модели с отворен код, модели за генериране на изображения/видео, модели за реч, модели за код/математика, както и векторни модели и модели за пренареждане.
Платформата позволява на разработчиците свободно да сравняват и комбинират големи модели от различни модалности, за да изберат най-добрата практика за своето приложение за генеративен изкуствен интелект.

Сред тях над 20 големи модела API, като Qwen2.5 (7B) и Llama3.1 (8B), са безплатни за използване, което позволява на разработчиците и продуктовите мениджъри да постигнат "свобода на символите", без да се притесняват за разходите за изчислителна мощност по време на етапа на научноизследователска и развойна дейност и широкомащабното популяризиране.