První spuštění! SiliconFlow X Huawei Cloud společně spouštějí inferenční služby DeepSeek R1 a V3 založené na Ascend Cloud!

DeepSeek-R1 a DeepSeek-V3 způsobily od svého uvedení na trh s otevřeným zdrojovým kódem celosvětovou senzaci.

Jsou darem týmu DeepSeek celému lidstvu a my jsme upřímně rádi za jejich úspěch.

Po několika dnech tvrdé práce týmů Silicon Mobility a Huawei Cloud dnes dáváme čínským uživatelům dárek k čínskému Novému roku: platforma pro velkoplošné modelové cloudové služby SiliconCloud uvedla na trh modely DeepSeek-V3 a DeepSeek-R1, které jsou založeny na cloudové službě Huawei Cloud Ascend.

Je třeba zdůraznit, že se nám dostalo velké podpory od společností DeepSeek a Huawei Cloud, a to jak při adaptaci DeepSeek-R1 & V3 na Ascend, tak při dřívějším uvádění dalších modelů, za což bychom jim chtěli vyjádřit hlubokou vděčnost a velký respekt.

Obsah

Funkce

Tyto dva modely uvedené na trh společností SiliconCloud zahrnují především pět hlavních funkcí:

Na základě cloudové služby Ascend společnosti Huawei Cloud jsme spustili službu DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 poprvé model inference služby.

Díky společným inovacím obou stran a s podporou vlastního vyvinutého akcelerátoru inference může model DeepSeek nasazený týmem Silicon Mobility na základě cloudové služby Huawei Cloud Ascend dosáhnout stejného účinku jako model nasazení špičkového GPU ve světě.

Poskytování stabilních inferenčních služeb na produkční úrovni DeepSeek-R1 a V3. To umožňuje vývojářům stabilní provoz v rozsáhlých produkčních prostředích a splňuje potřeby komerčního nasazení. Služby Huawei Cloud Ascend AI poskytují bohatý, pružný a dostatečný výpočetní výkon.

Neexistuje žádný práh pro nasazení, což vývojářům umožňuje více se soustředit na vývoj aplikací. Při vývoji aplikací mohou přímo volat rozhraní API SiliconCloudu, což poskytuje jednodušší a uživatelsky přívětivější prostředí.

Cena DeepSeek-V3 na SiliconCloudu během oficiální slevové akce (do 8. února do 24:00) je 1 M tokenů (vstup) a 2 M tokenů (výstup) a cena DeepSeek-R1 je 4 M tokenů (vstup) a 16 M tokenů (výstup).

Zkušenosti online

DeepSeek-R1 se společností SiliconCloud

DeepSeek-V3 se společností SiliconCloud

Dokumentace API

API

Vývojáři si mohou na SiliconCloudu vyzkoušet efekt akcelerace DeepSeek-R1 a V3 na domácích čipech. Rychlejší výstupní rychlost je stále průběžně optimalizována.

Zkušenosti s klientskými aplikacemi

Chcete-li si vyzkoušet model DeepSeek-R1 a V3 přímo v klientské aplikaci, můžete si lokálně nainstalovat následující produkty a získat přístup k rozhraní SiliconCloud API (tyto dva modely si můžete přizpůsobit a přidat) a vyzkoušet si model DeepSeek-R1 a V3.

Velké modelové klientské aplikace: ChatBox, Cherry Studio, OneAPI, LobeChat, NextChat
Aplikace pro generování kódu: Kurzor, Windsurfing, Cline
Platforma pro vývoj velkých modelových aplikací:Dify
znalostní báze AI:Umělá inteligence ObsidiánaFastGPT
Překlad plug-in:Immersive Translate aEurodict

Další scénáře a výukové programy pro přístup k případům aplikací naleznete na adrese zde

Továrna na tokeny SiliconCloud

Qwen2.5 (7B) atd. Více než 20 modelů zdarma k použití

SiliconCloud je platformou komplexních cloudových služeb pro velké modely a snaží se vývojářům poskytovat rozhraní API pro modely, která jsou mimořádně rychlá, cenově dostupná, komplexní a mají hedvábně hladký chod.

Kromě DeepSeek-R1 a DeepSeek-V3 uvedla společnost SiliconCloud na trh také Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

desítky velkých jazykových modelů s otevřeným zdrojovým kódem, modelů pro generování obrázků/videí, řečových modelů, kódových/matematických modelů a vektorových modelů a modelů pro změnu pořadí.

Platforma umožňuje vývojářům volně porovnávat a kombinovat rozsáhlé modely různých modalit a vybrat si tak nejlepší postup pro svou aplikaci generativní umělé inteligence.

Mezi nimi je více než 20 velkých modelových rozhraní API, například Qwen2.5 (7B) a Llama3.1 (8B), která jsou k dispozici zdarma, což vývojářům a produktovým manažerům umožňuje dosáhnout "svobody žetonů" bez obav o náklady na výpočetní výkon ve fázi výzkumu a vývoje a propagace ve velkém měřítku.

Podobné příspěvky

Nezařazené

Gemini 2.0 dominuje žebříčkům, zatímco DeepSeek V3 pláče ve své ceně a nový nákladově efektivní šampion je na světě!

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Rodina Google Gemini 2.0 je konečně kompletní! Vévodí žebříčkům hned po vydání. Uprostřed pronásledování a blokád Deepseek, Qwen a o3 vydal Google dnes brzy ráno tři modely najednou: Gemini 2.0 Pro, Gemini 2.0 Flash a Gemini 2.0 Flash-Lite. V žebříčku velkých modelů LMSYS, Gemini…

Nezařazené

Tajemství DeepSeek 1 | Podrobnosti DeepSeekMath a GRPO

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

Dnes bych se rád podělil o článek od DeepSeek s názvem DeepSeekMath: Posouvání limitů matematického uvažování v modelech otevřených jazyků. Tento článek představuje DeepSeekMath 7B, který je předtrénován na DeepSeek-Coder-Base-v1.5 7B na základě kolekce 120B matematických tokenů, přirozeného jazyka a dat kódu. Model dosáhl úžasného skóre 51,7% v soutěžní úrovni…

Nezařazené

Aktualizace DeepSeek-R1-0528: Hlubší myšlení, silnější uvažování

Podlezddeepseeker 29. května 202529. května 2025

Model DeepSeek R1 prošel drobnou aktualizací verze, aktuální verze je DeepSeek-R1-0528. Po vstupu na webovou stránku nebo do aplikace DeepSeek povolte v dialogovém okně funkci „Hluboké myšlení“ a vyzkoušejte nejnovější verzi. Závaží modelu DeepSeek-R1-0528 byla nahrána na HuggingFace. Během posledních čtyř měsíců prošel model DeepSeek-R1…

Nezařazené

Le Chat vede žebříčky s investicí ve výši sta miliard dolarů. Je po USA a Číně třetí mocností umělé inteligence?

Podlezddeepseeker Únor 11, 2025Únor 11, 2025

9. února francouzský prezident Emmanuel Macron oznámil, že Francie v příštích několika letech investuje 109 miliard eur (113 miliard amerických dolarů) do oblasti umělé inteligence. Tato investice bude použita na vybudování parku umělé inteligence ve Francii, zlepšení infrastruktury a investic do místních start-upů zaměřených na umělou inteligenci. Mezitím Mistral, francouzský startup,…

Nezařazené

DeepSeek to dokázal! OpenAI přiznává chybu uzavřeného kódu, náskok před ostatními se zmenšuje

Podlezddeepseeker Únor 2, 2025Únor 2, 2025

Poté, co společnost OpenAI zveřejnila model o3-mini, její generální ředitel Sam Altman, ředitel výzkumu Mark Chen, produktový ředitel Kevin Weil, viceprezident pro inženýrství Srinivas Narayanan, vedoucí výzkumu API Michelle Pokrass a vedoucí výzkumu Hongyu Ren vedli online technické otázky a odpovědi na redditu, jednom z největších světových fór. Hlavní témata...

Nezařazené

V okruhu AI DeepSeek R1 ve fyzických testech postupně překonává o1 a Claude a my jsme vstoupili do zlatého věku RL.

Podlezddeepseeker Únor 1, 2025Únor 1, 2025

Nikdo z nás nečekal, že právě takto začne rok 2025 v oblasti umělé inteligence. DeepSeek R1 je skutečně úžasný! V poslední době "tajemná východní mocnost" DeepSeek "tvrdě ovládá" Silicon Valley. Požádal jsem R1, aby mi podrobně vysvětlil Pythagorovu větu. To vše umělá inteligence zvládla za méně než 30 sekund bez jakéhokoli...

Funkce

Zkušenosti online

Dokumentace API

Zkušenosti s klientskými aplikacemi

Továrna na tokeny SiliconCloud

Podobné příspěvky

Napsat komentář Zrušit odpověď na komentář