DeepSeek-R1 и DeepSeek-V3 предизвикаа глобална сензација од нивното лансирање со отворен код.

Тие се подарок од тимот на DeepSeek за целото човештво и ние сме искрено среќни за нивниот успех.

По неколкудневна напорна работа од тимовите на Silicon Mobility и Huawei Cloud, денес им подаруваме и на кинеските корисници кинеска новогодишен подарок: платформата за облак услуги од големи размери SiliconCloud ги лансираше DeepSeek-V3 и DeepSeek-R1, кои се засноваат на облак услугата Ascend на Huawei Cloud.

Треба да се нагласи дека добивме голема поддршка од DeepSeek и Huawei Cloud, како во прилагодувањето на DeepSeek-R1 и V3 на Ascend, така и во процесот на лансирање на други модели претходно, и сакаме да изразиме длабока благодарност и висока почит.

Карактеристики

Овие два модели лансирани од SiliconCloud главно вклучуваат пет главни карактеристики:

Врз основа на услугата Ascend облак на Huawei Cloud, го лансиравме DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 услуга за заклучување на моделот за прв пат.

Преку заедничка иновација помеѓу двете страни и со поддршка на саморазвиениот мотор за забрзување на заклучоците, моделот DeepSeek распореден од тимот на Silicon Mobility заснован на облак услугата Ascend на Huawei Cloud може да го постигне истиот ефект како и моделот за распоредување графички процесор од висока класа. во светот.

Обезбедете стабилни услуги за заклучување DeepSeek-R1 и V3 на ниво на производство. Ова им овозможува на програмерите да работат стабилно во големи производствени средини и да ги задоволат потребите за комерцијално распоредување. Услугите на Huawei Cloud Ascend AI обезбедуваат обилна, еластична и доволна компјутерска моќ.

Не постои праг за распоредување, што им овозможува на програмерите да се фокусираат повеќе на развојот на апликации. Кога развиваат апликации, тие можат директно да го повикаат SiliconCloud API, што овозможува полесно и попријатно искуство за корисниците.

Цената DeepSeek-V3 на SiliconCloud за време на официјалниот период на попуст (до 24:00 часот на 8 февруари) е 1 ¥ / M токени (влез) и ¥2 / M токени (излез), а цената DeepSeek-R1 е 4 ¥ / M токени (влез) и 16 ¥ / M токени (излез).

Онлајн искуство

DeepSeek-R1 со SiliconCloud

DeepSeek-V3 со SiliconCloud

API документација

API

Програмерите можат да го искусат ефектот на DeepSeek-R1 и V3 забрзан на домашните чипови на SiliconCloud. Побрзата излезна брзина сè уште континуирано се оптимизира.

Искуство во клиентска апликација

Ако сакате да го искусите моделот DeepSeek-R1 и V3 директно во клиентската апликација, можете да ги инсталирате следните производи локално и да пристапите до SiliconCloud API (можете да ги приспособите и додадете овие два модели) за да ги искусите DeepSeek-R1 и V3.

  • Големи модели на клиентски апликации: Кутија за разговор, Cherry Studio, OneAPI, LobeChat, NextChat
  • Апликации за генерирање кодови: Покажувачот, сурфање на ветер, Клајн
  • Платформа за развој на апликации со голем модел:Dify
  • База на знаење за вештачка интелигенција:Обсидијан АИ, иFastGPT
  • Приклучок за превод:Immersive Translate и Eurodict

За повеќе упатства за пристап до сценарија и случаи на апликација, ве молиме погледнете овде

Token Factory SiliconCloud

Qwen2.5 (7B), итн. 20+ модели бесплатни за користење

Како едношалтерска платформа за облак услуга за големи модели, SiliconCloud е посветена да им обезбеди на програмерите моделски API кои се ултра одговорни, достапни, сеопфатни и имаат свилено-мазно искуство.

Покрај DeepSeek-R1 и DeepSeek-V3, SiliconCloud лансираше и Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70BV-Instruct , рибен говор-1,5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

десетици модели на големи јазици со отворен код, модели за генерирање слики/видео, модели на говор, модели на код/математика и модели на вектори и преуредување.

Платформата им овозможува на програмерите слободно да споредуваат и комбинираат големи модели на различни модалитети за да ја изберат најдобрата практика за вашата генеративна апликација за вештачка интелигенција.

Меѓу нив, 20+ големи моделски API како што се Qwen2.5 (7B) и Llama3.1 (8B) се бесплатни за употреба, дозволувајќи им на програмерите и менаџерите на производи да постигнат „токенска слобода“ без да се грижат за трошоците за компјутерската моќ за време на истражувањето и фаза на развој и голема промоција.

Слични објави

Напишете коментар

Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени со *