DeepSeek-R1 a DeepSeek-V3 způsobily od svého uvedení na trh s otevřeným zdrojovým kódem celosvětovou senzaci.

Jsou darem týmu DeepSeek celému lidstvu a my jsme upřímně rádi za jejich úspěch.

Po několika dnech tvrdé práce týmů Silicon Mobility a Huawei Cloud dnes dáváme čínským uživatelům dárek k čínskému Novému roku: platforma pro velkoplošné modelové cloudové služby SiliconCloud uvedla na trh modely DeepSeek-V3 a DeepSeek-R1, které jsou založeny na cloudové službě Huawei Cloud Ascend.

Je třeba zdůraznit, že se nám dostalo velké podpory od společností DeepSeek a Huawei Cloud, a to jak při adaptaci DeepSeek-R1 & V3 na Ascend, tak při dřívějším uvádění dalších modelů, za což bychom jim chtěli vyjádřit hlubokou vděčnost a velký respekt.

Funkce

Tyto dva modely uvedené na trh společností SiliconCloud zahrnují především pět hlavních funkcí:

Na základě cloudové služby Ascend společnosti Huawei Cloud jsme spustili službu DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 poprvé model inference služby.

Díky společným inovacím obou stran a s podporou vlastního vyvinutého akcelerátoru inference může model DeepSeek nasazený týmem Silicon Mobility na základě cloudové služby Huawei Cloud Ascend dosáhnout stejného účinku jako model nasazení špičkového GPU ve světě.

Poskytování stabilních inferenčních služeb na produkční úrovni DeepSeek-R1 a V3. To umožňuje vývojářům stabilní provoz v rozsáhlých produkčních prostředích a splňuje potřeby komerčního nasazení. Služby Huawei Cloud Ascend AI poskytují bohatý, pružný a dostatečný výpočetní výkon.

Neexistuje žádný práh pro nasazení, což vývojářům umožňuje více se soustředit na vývoj aplikací. Při vývoji aplikací mohou přímo volat rozhraní API SiliconCloudu, což poskytuje jednodušší a uživatelsky přívětivější prostředí.

Cena DeepSeek-V3 na SiliconCloudu během oficiální slevové akce (do 8. února do 24:00) je 1 M tokenů (vstup) a 2 M tokenů (výstup) a cena DeepSeek-R1 je 4 M tokenů (vstup) a 16 M tokenů (výstup).

Zkušenosti online

DeepSeek-R1 se společností SiliconCloud

DeepSeek-V3 se společností SiliconCloud

Dokumentace API

API

Vývojáři si mohou na SiliconCloudu vyzkoušet efekt akcelerace DeepSeek-R1 a V3 na domácích čipech. Rychlejší výstupní rychlost je stále průběžně optimalizována.

Zkušenosti s klientskými aplikacemi

Chcete-li si vyzkoušet model DeepSeek-R1 a V3 přímo v klientské aplikaci, můžete si lokálně nainstalovat následující produkty a získat přístup k rozhraní SiliconCloud API (tyto dva modely si můžete přizpůsobit a přidat) a vyzkoušet si model DeepSeek-R1 a V3.

  • Velké modelové klientské aplikace: ChatBox, Cherry Studio, OneAPI, LobeChat, NextChat
  • Aplikace pro generování kódu: Kurzor, Windsurfing, Cline
  • Platforma pro vývoj velkých modelových aplikací:Dify
  • znalostní báze AI:Umělá inteligence ObsidiánaFastGPT
  • Překlad plug-in:Immersive Translate aEurodict

Další scénáře a výukové programy pro přístup k případům aplikací naleznete na adrese zde

Továrna na tokeny SiliconCloud

Qwen2.5 (7B) atd. Více než 20 modelů zdarma k použití

SiliconCloud je platformou komplexních cloudových služeb pro velké modely a snaží se vývojářům poskytovat rozhraní API pro modely, která jsou mimořádně rychlá, cenově dostupná, komplexní a mají hedvábně hladký chod.

Kromě DeepSeek-R1 a DeepSeek-V3 uvedla společnost SiliconCloud na trh také Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

desítky velkých jazykových modelů s otevřeným zdrojovým kódem, modelů pro generování obrázků/videí, řečových modelů, kódových/matematických modelů a vektorových modelů a modelů pro změnu pořadí.

Platforma umožňuje vývojářům volně porovnávat a kombinovat rozsáhlé modely různých modalit a vybrat si tak nejlepší postup pro svou aplikaci generativní umělé inteligence.

Mezi nimi je více než 20 velkých modelových rozhraní API, například Qwen2.5 (7B) a Llama3.1 (8B), která jsou k dispozici zdarma, což vývojářům a produktovým manažerům umožňuje dosáhnout "svobody žetonů" bez obav o náklady na výpočetní výkon ve fázi výzkumu a vývoje a propagace ve velkém měřítku.

Podobné příspěvky

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *