DeepSeek-R1 ve DeepSeek-V3 açık kaynak lansmanından bu yana küresel bir sansasyon yarattı.

Onlar DeepSeek ekibinin tüm insanlığa bir armağanıdır ve başarılarından dolayı içtenlikle mutluyuz.

Silicon Mobility ve Huawei Cloud ekiplerinin günlerce süren yoğun çalışmalarının ardından, bugün Çinli kullanıcılara bir Çin Yeni Yılı hediyesi de veriyoruz: büyük ölçekli model bulut hizmeti platformu SiliconCloud, Huawei Cloud'un Ascend bulut hizmetini temel alan DeepSeek-V3 ve DeepSeek-R1'i piyasaya sürdü.

Gerek DeepSeek-R1 & V3'ün Ascend'e uyarlanmasında gerekse daha önce diğer modellerin piyasaya sürülmesi sürecinde DeepSeek ve Huawei Cloud'dan büyük destek aldığımızı vurgulamak ister, derin şükran ve yüksek saygılarımızı sunarız.

Özellikler

SiliconCloud tarafından piyasaya sürülen bu iki model temel olarak beş ana özellik içermektedir:

Huawei Cloud'un Ascend bulut hizmetini temel alarak DeepSeek x Silicon Mobility x Huawei Cloud R1 & V3 model çıkarım hizmeti ilk kez.

İki taraf arasındaki ortak inovasyon sayesinde ve kendi geliştirdiği çıkarım hızlandırma motorunun desteğiyle, Silicon Mobility ekibi tarafından Huawei Cloud'un Ascend bulut hizmetine dayalı olarak dağıtılan DeepSeek modeli, dünyadaki üst düzey bir GPU dağıtım modeliyle aynı etkiyi elde edebilir.

Üretim düzeyinde istikrarlı DeepSeek-R1 & V3 çıkarım hizmetleri sağlayın. Bu, geliştiricilerin büyük ölçekli üretim ortamlarında istikrarlı bir şekilde çalışmasına ve ticari dağıtım ihtiyaçlarını karşılamasına olanak tanır. Huawei Cloud Ascend AI hizmetleri bol, esnek ve yeterli bilgi işlem gücü sağlar.

Dağıtım eşiği yoktur, bu da geliştiricilerin uygulama geliştirmeye daha fazla odaklanmasına olanak tanır. Uygulama geliştirirken, daha kolay ve daha kullanıcı dostu bir deneyim sağlayan SiliconCloud API'sini doğrudan çağırabilirler.

Resmi indirim döneminde (8 Şubat saat 24:00'e kadar) SiliconCloud'daki DeepSeek-V3 fiyatı ¥1 / M token (giriş) & ¥2 / M token (çıkış) ve DeepSeek-R1 fiyatı ¥4 / M token (giriş) & ¥16 / M token (çıkış).

Çevrimiçi deneyim

DeepSeek-R1 SiliconCloud ile

DeepSeek-V3 SiliconCloud ile

API belgeleri

API

Geliştiriciler, SiliconCloud'daki yerli çiplerde hızlandırılmış DeepSeek-R1 & V3'ün etkisini deneyimleyebilirler. Daha hızlı çıkış hızı hala sürekli olarak optimize edilmektedir.

Müşteri uygulamalarında deneyim

DeepSeek-R1 & V3 modelini doğrudan istemci uygulamasında deneyimlemek istiyorsanız, aşağıdaki ürünleri yerel olarak yükleyebilir ve DeepSeek-R1 & V3'ü deneyimlemek için SiliconCloud API'sine erişebilirsiniz (bu iki modeli özelleştirebilir ve ekleyebilirsiniz).

  • Büyük model müşteri uygulamaları: ChatBox, Cherry Studio, OneAPI, LobeChat, NextChat
  • Kod oluşturma uygulamaları: İmleç, Rüzgar Sörfü, Cline
  • Büyük model uygulama geliştirme platformu:Dify
  • Yapay zeka bilgi tabanı:Obsidian Yapay ZekaveFastGPT
  • Çeviri eklentisi:Immersive Translate, veEurodict

Daha fazla senaryo ve uygulama örneği erişim eğitimleri için lütfen bkz. Burada

Token Fabrikası SiliconCloud

Qwen2.5 (7B), vb. 20+ model kullanımı ücretsiz

Büyük modeller için tek noktadan bulut hizmeti platformu olarak SiliconCloud, geliştiricilere ultra duyarlı, uygun fiyatlı, kapsamlı ve ipeksi pürüzsüz bir deneyime sahip model API'leri sağlamayı taahhüt eder.

SiliconCloud, DeepSeek-R1 ve DeepSeek-V3'ün yanı sıra Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1'i de piyasaya sürdü, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

düzinelerce açık kaynaklı büyük dil modeli, görüntü/video oluşturma modelleri, konuşma modelleri, kod/matematik modelleri ve vektör ve yeniden sıralama modelleri.

Platform, geliştiricilerin üretken yapay zeka uygulamanız için en iyi uygulamayı seçmek üzere çeşitli modalitelerin büyük modellerini özgürce karşılaştırmasına ve birleştirmesine olanak tanır.

Bunlar arasında, Qwen2.5 (7B) ve Llama3.1 (8B) gibi 20'den fazla büyük model API'nin kullanımı ücretsizdir ve geliştiricilerin ve ürün yöneticilerinin araştırma ve geliştirme aşamasında ve büyük ölçekli tanıtım sırasında bilgi işlem gücü maliyeti konusunda endişelenmeden "token özgürlüğü" elde etmelerine olanak tanır.

Benzer Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir