
DeepSeek-R1 và DeepSeek-V3 đã gây chấn động toàn cầu kể từ khi ra mắt mã nguồn mở.
Chúng là món quà mà nhóm DeepSeek dành tặng cho toàn thể nhân loại và chúng tôi thực sự vui mừng vì thành công của họ.
Sau nhiều ngày làm việc chăm chỉ của nhóm Silicon Mobility và Huawei Cloud, hôm nay chúng tôi cũng tặng người dùng Trung Quốc một món quà Tết Nguyên đán: Nền tảng dịch vụ đám mây mô hình quy mô lớn SiliconCloud đã ra mắt DeepSeek-V3 và DeepSeek-R1 dựa trên dịch vụ đám mây Ascend của Huawei Cloud.
Xin nhấn mạnh rằng chúng tôi đã nhận được sự hỗ trợ to lớn từ DeepSeek và Huawei Cloud, trong quá trình đưa DeepSeek-R1 & V3 vào Ascend cũng như trong quá trình ra mắt các mẫu máy khác trước đây, và chúng tôi xin gửi lời cảm ơn sâu sắc và sự tôn trọng cao nhất.

Đặc trưng
Hai mô hình do SiliconCloud ra mắt này chủ yếu bao gồm năm tính năng chính:
Dựa trên dịch vụ đám mây Ascend của Huawei Cloud, chúng tôi đã ra mắt DeepSeek x Silicon Mobility x Dịch vụ suy luận mô hình Huawei Cloud R1 & V3 lần đầu tiên.
Thông qua sự đổi mới chung giữa hai bên và với sự hỗ trợ của công cụ tăng tốc suy luận do chính họ phát triển, mô hình DeepSeek do nhóm Silicon Mobility triển khai dựa trên dịch vụ đám mây Ascend của Huawei Cloud có thể đạt được hiệu quả tương tự như mô hình triển khai GPU cao cấp trên thế giới.
Cung cấp dịch vụ suy luận DeepSeek-R1 & V3 cấp sản xuất ổn định. Điều này cho phép các nhà phát triển chạy ổn định trong môi trường sản xuất quy mô lớn và đáp ứng nhu cầu triển khai thương mại. Dịch vụ AI Huawei Cloud Ascend cung cấp sức mạnh tính toán dồi dào, linh hoạt và đủ dùng.
Không có ngưỡng triển khai, cho phép các nhà phát triển tập trung nhiều hơn vào phát triển ứng dụng. Khi phát triển ứng dụng, họ có thể gọi trực tiếp SiliconCloud API, cung cấp trải nghiệm dễ dàng và thân thiện hơn với người dùng.
Giá DeepSeek-V3 trên SiliconCloud trong thời gian giảm giá chính thức (cho đến 24:00 ngày 8 tháng 2) là 1 Yên/M token (đầu vào) và 2 Yên/M token (đầu ra), còn giá DeepSeek-R1 là 4 Yên/M token (đầu vào) và 16 Yên/M token (đầu ra).

Trải nghiệm trực tuyến
DeepSeek-R1 với SiliconCloud
DeepSeek-V3 với SiliconCloud
Tài liệu API
Giao diện lập trình ứng dụng (API)
Các nhà phát triển có thể trải nghiệm hiệu ứng của DeepSeek-R1 & V3 được tăng tốc trên chip trong nước trên SiliconCloud. Tốc độ đầu ra nhanh hơn vẫn đang được tối ưu hóa liên tục.


Kinh nghiệm trong ứng dụng khách hàng
Nếu bạn muốn trải nghiệm model DeepSeek-R1 & V3 trực tiếp trong ứng dụng khách, bạn có thể cài đặt các sản phẩm sau tại địa phương và truy cập SiliconCloud API (bạn có thể tùy chỉnh và thêm hai model này) để trải nghiệm DeepSeek-R1 & V3.
- Ứng dụng khách hàng mô hình lớn: Hộp trò chuyện, Xưởng Cherry, OneAPI, LobeChat, NextChat
- Ứng dụng tạo mã: Con trỏ, Lướt ván buồm, Cline
- Nền tảng phát triển ứng dụng mô hình lớn:Làm cho
- Cơ sở kiến thức AI:Trí tuệ nhân tạo Obsidian, VàNhanhGPT
- Tiện ích bổ sung dịch thuật:Dịch thuật nhập vai và Eurodict
Để biết thêm hướng dẫn về cách truy cập trường hợp ứng dụng và kịch bản, vui lòng tham khảo đây
Nhà máy Token SiliconCloud
Qwen2.5 (7B), v.v. Hơn 20 mô hình miễn phí sử dụng
Là nền tảng dịch vụ đám mây trọn gói cho các mô hình lớn, SiliconCloud cam kết cung cấp cho các nhà phát triển các API mô hình có khả năng phản hồi cực nhanh, giá cả phải chăng, toàn diện và mang lại trải nghiệm mượt mà.
Ngoài DeepSeek-R1 và DeepSeek-V3, SiliconCloud cũng đã ra mắt Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,
hàng chục mô hình ngôn ngữ nguồn mở lớn, mô hình tạo hình ảnh/video, mô hình giọng nói, mô hình mã/toán học, mô hình vector và sắp xếp lại.
Nền tảng này cho phép các nhà phát triển tự do so sánh và kết hợp các mô hình lớn của nhiều phương thức khác nhau để lựa chọn phương pháp tốt nhất cho ứng dụng AI tạo sinh của bạn.

Trong số đó, hơn 20 API mô hình lớn như Qwen2.5 (7B) và Llama3.1 (8B) được sử dụng miễn phí, cho phép các nhà phát triển và quản lý sản phẩm đạt được "sự tự do về mã thông báo" mà không phải lo lắng về chi phí cho sức mạnh tính toán trong giai đoạn nghiên cứu và phát triển cũng như quảng bá trên quy mô lớn.