Прво лансирање! SiliconFlow X Huawei Cloud заеднички ги лансираше услугите за заклучување DeepSeek R1 и V3 базирани на Ascend Cloud!

DeepSeek-R1 и DeepSeek-V3 предизвикаа глобална сензација од нивното лансирање со отворен код.

Тие се подарок од тимот на DeepSeek за целото човештво и ние сме искрено среќни за нивниот успех.

По неколкудневна напорна работа од тимовите на Silicon Mobility и Huawei Cloud, денес им подаруваме и на кинеските корисници кинеска новогодишен подарок: платформата за облак услуги од големи размери SiliconCloud ги лансираше DeepSeek-V3 и DeepSeek-R1, кои се засноваат на облак услугата Ascend на Huawei Cloud.

Треба да се нагласи дека добивме голема поддршка од DeepSeek и Huawei Cloud, како во прилагодувањето на DeepSeek-R1 и V3 на Ascend, така и во процесот на лансирање на други модели претходно, и сакаме да изразиме длабока благодарност и висока почит.

Содржина

Карактеристики

Овие два модели лансирани од SiliconCloud главно вклучуваат пет главни карактеристики:

Врз основа на услугата Ascend облак на Huawei Cloud, го лансиравме DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 услуга за заклучување на моделот за прв пат.

Преку заедничка иновација помеѓу двете страни и со поддршка на саморазвиениот мотор за забрзување на заклучоците, моделот DeepSeek распореден од тимот на Silicon Mobility заснован на облак услугата Ascend на Huawei Cloud може да го постигне истиот ефект како и моделот за распоредување графички процесор од висока класа. во светот.

Обезбедете стабилни услуги за заклучување DeepSeek-R1 и V3 на ниво на производство. Ова им овозможува на програмерите да работат стабилно во големи производствени средини и да ги задоволат потребите за комерцијално распоредување. Услугите на Huawei Cloud Ascend AI обезбедуваат обилна, еластична и доволна компјутерска моќ.

Не постои праг за распоредување, што им овозможува на програмерите да се фокусираат повеќе на развојот на апликации. Кога развиваат апликации, тие можат директно да го повикаат SiliconCloud API, што овозможува полесно и попријатно искуство за корисниците.

Цената DeepSeek-V3 на SiliconCloud за време на официјалниот период на попуст (до 24:00 часот на 8 февруари) е 1 ¥ / M токени (влез) и ¥2 / M токени (излез), а цената DeepSeek-R1 е 4 ¥ / M токени (влез) и 16 ¥ / M токени (излез).

Онлајн искуство

DeepSeek-R1 со SiliconCloud

DeepSeek-V3 со SiliconCloud

API документација

API

Програмерите можат да го искусат ефектот на DeepSeek-R1 и V3 забрзан на домашните чипови на SiliconCloud. Побрзата излезна брзина сè уште континуирано се оптимизира.

Искуство во клиентска апликација

Ако сакате да го искусите моделот DeepSeek-R1 и V3 директно во клиентската апликација, можете да ги инсталирате следните производи локално и да пристапите до SiliconCloud API (можете да ги приспособите и додадете овие два модели) за да ги искусите DeepSeek-R1 и V3.

Големи модели на клиентски апликации: Кутија за разговор, Cherry Studio, OneAPI, LobeChat, NextChat
Апликации за генерирање кодови: Покажувачот, сурфање на ветер, Клајн
Платформа за развој на апликации со голем модел:Dify
База на знаење за вештачка интелигенција:Обсидијан АИ, иFastGPT
Приклучок за превод:Immersive Translate и Eurodict

За повеќе упатства за пристап до сценарија и случаи на апликација, ве молиме погледнете овде

Token Factory SiliconCloud

Qwen2.5 (7B), итн. 20+ модели бесплатни за користење

Како едношалтерска платформа за облак услуга за големи модели, SiliconCloud е посветена да им обезбеди на програмерите моделски API кои се ултра одговорни, достапни, сеопфатни и имаат свилено-мазно искуство.

Покрај DeepSeek-R1 и DeepSeek-V3, SiliconCloud лансираше и Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70BV-Instruct , рибен говор-1,5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

десетици модели на големи јазици со отворен код, модели за генерирање слики/видео, модели на говор, модели на код/математика и модели на вектори и преуредување.

Платформата им овозможува на програмерите слободно да споредуваат и комбинираат големи модели на различни модалитети за да ја изберат најдобрата практика за вашата генеративна апликација за вештачка интелигенција.

Меѓу нив, 20+ големи моделски API како што се Qwen2.5 (7B) и Llama3.1 (8B) се бесплатни за употреба, дозволувајќи им на програмерите и менаџерите на производи да постигнат „токенска слобода“ без да се грижат за трошоците за компјутерската моќ за време на истражувањето и фаза на развој и голема промоција.

Некатегоризирано

Алтман: Згрешивме за вештачката интелигенција со отворен код! DeepSeek го направи OpenAI помалку поволен, а следниот е GPT-5

Од страна наzddeepseeker 1 февруари 2025 година1 февруари 2025 година

o3-mini пристигна доцна во ноќта, а OpenAI конечно го откри својот најнов адут. За време на Reddit AMA Q&A, Алтман длабоко призна дека застанал на погрешната страна на вештачката интелигенција со отворен код. Тој рече дека се разгледува внатрешната стратегија на отворен код, а моделот ќе продолжи да се развива, но…

Некатегоризирано

Блиску е до DeepSeek-R1-32B и го скрши s1 на Fei-Fei Li! UC Berkeley и други нови модели на SOTA заклучоци со отворен код

Од страна наzddeepseeker 14 февруари 2025 година14 февруари 2025 година

Моделот за заклучување 32B користи само 1/8 од податоците и е врзан со DeepSeek-R1 со иста големина! Токму сега, институциите како што се Стенфорд, УК Беркли и Универзитетот во Вашингтон заеднички објавија модел за заклучување на ниво на SOTA, OpenThinker-32B, а исто така имаат отворен извор до 114k податоци за обука. Почетна страница на проектот OpenThinker: Лице гушкање OpenThinker:…

Некатегоризирано

Главните светски производи со вештачка интелигенција се фокусираат на анализа и сеопфатни упатства за корисничко искуство (вклучувајќи DeepSeek и GPT)

Од страна наzddeepseeker 10 февруари 2025 година10 февруари 2025 година

Позиционирање на функции и анализа на основните предности ChatGPT (OpenAI) – глобален репер за сеопфатни ChatGPT Технички гени: генеративна вештачка интелигенција базирана на серијата големи модели на GPT, со општи вештини за разговор и логично расудување како основни предности. Повеќејазична обработка: најдобро функционира на англиски, со континуирано подобрување на кинескиот; но препорачуваме да го користиме англискиот јазик за да…

Некатегоризирано

Што е FlashMLA? Сеопфатен водич за неговото влијание врз кернелите за декодирање на вештачката интелигенција

Од страна на1TP7 Тер 24 февруари 2025 година24 февруари 2025 година

FlashMLA брзо привлече внимание во светот на вештачката интелигенција, особено во областа на големи јазични модели (LLMs). Оваа иновативна алатка, развиена од DeepSeek, служи како оптимизирано јадро за декодирање дизајнирано за графички процесори на Hopper - чипови со високи перформанси кои вообичаено се користат во пресметките со вештачка интелигенција. FlashMLA се фокусира на ефикасна обработка на секвенци со променлива должина, што го прави особено добро прилагоден…

Некатегоризирано

Откриена е технологијата DeepSeek-R1: основните принципи на хартијата се расчленети и клучот за пробивните перформанси на моделот е откриен

Од страна наzddeepseeker 9 февруари 2025 година9 февруари 2025 година

Денес ќе споделиме DeepSeek R1, Наслов: DeepSeek-R1: Поттикнување на способноста за расудување кај LLM преку учење за зајакнување: Поттикнување на способноста за расудување на LLM преку учење за засилување. Овој труд ја воведува првата генерација на модели за расудување на DeepSeek, DeepSeek-R1-Zero и DeepSeek-R1. Моделот DeepSeek-R1-Zero беше обучен преку учење за засилување од големи размери (RL) без надгледувано фино подесување (SFT) како почетен чекор,…

Некатегоризирано

DeepSeek R1 толкување на хартија и клучни технички точки

Од страна наzddeepseeker 9 февруари 2025 година9 февруари 2025 година

1 Позадина За време на пролетниот фестивал, DeepSeek R1 повторно привлече големо внимание, па дури и написот за толкување на DeepSeek V3 што претходно го напишавме исто така беше повторно пренесен и многу дискутиран. Иако имаше многу анализи и репродукции на DeepSeek R1, овде решивме да составиме некои соодветни белешки за читање. Ќе користиме три…

Карактеристики

Онлајн искуство

API документација

Искуство во клиентска апликација

Token Factory SiliconCloud

Слични објави

Напишете коментар Откажи одговор