Peluncuran pertama! SiliconFlow X Huawei Cloud bersama-sama meluncurkan layanan inferensi DeepSeek R1 & V3 berdasarkan Ascend Cloud!

DeepSeek-R1 dan DeepSeek-V3 telah menimbulkan sensasi global sejak peluncuran open source mereka.

Mereka adalah hadiah dari tim DeepSeek untuk seluruh umat manusia, dan kami dengan tulus senang atas keberhasilan mereka.

Setelah berhari-hari bekerja keras oleh tim Silicon Mobility dan Huawei Cloud, hari ini kami juga memberikan hadiah Tahun Baru Imlek kepada pengguna di Tiongkok: platform layanan cloud model skala besar SiliconCloud telah meluncurkan DeepSeek-V3 dan DeepSeek-R1, yang didasarkan pada layanan cloud Ascend dari Huawei Cloud.

Perlu ditekankan bahwa kami telah menerima dukungan besar dari DeepSeek dan Huawei Cloud, baik dalam mengadaptasi DeepSeek-R1 & V3 di Ascend dan dalam proses peluncuran model lain sebelumnya, dan kami ingin mengucapkan terima kasih yang dalam dan rasa hormat yang tinggi.

Daftar Isi

Fitur

Kedua model yang diluncurkan oleh SiliconCloud ini, terutama mencakup lima fitur utama:

Berdasarkan layanan cloud Ascend dari Huawei Cloud, kami telah meluncurkan DeepSeek x Silicon Mobility x Layanan inferensi model Huawei Cloud R1 & V3 untuk pertama kalinya.

Melalui inovasi bersama antara kedua belah pihak, dan dengan dukungan mesin akselerasi inferensi yang dikembangkan sendiri, model DeepSeek yang digunakan oleh tim Silicon Mobility berdasarkan layanan cloud Ascend dari Huawei Cloud dapat mencapai efek yang sama dengan model penyebaran GPU kelas atas di dunia.

Menyediakan layanan inferensi DeepSeek-R1 & V3 tingkat produksi yang stabil. Hal ini memungkinkan pengembang untuk berjalan dengan stabil di lingkungan produksi berskala besar dan memenuhi kebutuhan penerapan komersial. Layanan Huawei Cloud Ascend AI menyediakan daya komputasi yang melimpah, elastis, dan memadai.

Tidak ada ambang batas penerapan, sehingga pengembang dapat lebih fokus pada pengembangan aplikasi. Ketika mengembangkan aplikasi, mereka dapat langsung memanggil API SiliconCloud, yang memberikan pengalaman yang lebih mudah dan ramah pengguna.

Harga DeepSeek-V3 di SiliconCloud selama periode diskon resmi (hingga pukul 24:00 tanggal 8 Februari) adalah ¥1/M token (input) & ¥2/M token (output), dan harga DeepSeek-R1 adalah ¥4/M token (input) & ¥16/M token (output).

Pengalaman online

DeepSeek-R1 dengan SiliconCloud

DeepSeek-V3 dengan SiliconCloud

Dokumentasi API

API

Para pengembang dapat merasakan efek akselerasi DeepSeek-R1 & V3 pada chip domestik di SiliconCloud. Kecepatan output yang lebih cepat masih terus dioptimalkan.

Pengalaman dalam aplikasi klien

Jika Anda ingin merasakan model DeepSeek-R1 & V3 secara langsung di aplikasi klien, Anda dapat menginstal produk berikut ini secara lokal dan mengakses API SiliconCloud (Anda dapat menyesuaikan dan menambahkan kedua model ini) untuk merasakan DeepSeek-R1 & V3.

Aplikasi klien model besar: Kotak Obrolan, Cherry Studio, OneAPI, LobeChat, NextChat
Aplikasi pembuatan kode: Kursor, Selancar Angin, Cline
Platform pengembangan aplikasi model besar:Dify
Basis pengetahuan AI:Obsidian AIdanFastGPT
Plug-in terjemahan:Terjemahan Imersif, danEurodict

Untuk skenario lebih lanjut dan tutorial akses kasus aplikasi, silakan merujuk ke di sini

Pabrik Token SiliconCloud

Qwen2.5 (7B), dll. 20+ model gratis untuk digunakan

Sebagai platform layanan cloud satu atap untuk model-model besar, SiliconCloud berkomitmen untuk menyediakan API model bagi para pengembang yang sangat responsif, terjangkau, komprehensif, dan memiliki pengalaman yang sangat mulus.

Selain DeepSeek-R1 dan DeepSeek-V3, SiliconCloud juga telah meluncurkan Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

lusinan model bahasa besar sumber terbuka, model pembuatan gambar/video, model ucapan, model kode/matematika, dan model vektor dan penyusunan ulang.

Platform ini memungkinkan pengembang untuk secara bebas membandingkan dan menggabungkan model-model besar dari berbagai modalitas untuk memilih praktik terbaik untuk aplikasi AI generatif Anda.

Di antara mereka, 20+ API model besar seperti Qwen2.5 (7B) dan Llama3.1 (8B) gratis untuk digunakan, memungkinkan pengembang dan manajer produk untuk mencapai "kebebasan token" tanpa mengkhawatirkan biaya daya komputasi selama tahap penelitian dan pengembangan serta promosi berskala besar.

Uncategorized

Produk AI arus utama dunia berfokus pada analisis dan pedoman pengalaman pengguna yang komprehensif (termasuk DeepSeek dan GPT)

Olehzddeepseeker 10 Februari 202510 Februari 2025

Pemosisian fungsi dan analisis keunggulan inti ChatGPT (OpenAI) – tolok ukur global untuk semua kalangan ChatGPT Gen teknis: AI generatif berdasarkan rangkaian model besar GPT, dengan keterampilan percakapan umum dan penalaran logis sebagai keunggulan intinya. Pemrosesan multibahasa: berkinerja terbaik dalam bahasa Inggris, dengan peningkatan berkelanjutan dalam bahasa Mandarin; tetapi kami sarankan untuk menggunakan bahasa Inggris untuk…

Uncategorized

Qwen2.5-max vs DeepSeek R1: Perbandingan mendalam antara kedua model: analisis lengkap skenario aplikasi

Olehzddeepseeker 14 Februari 202514 Februari 2025

Pendahuluan Saat ini, model bahasa besar (LLM) memegang peranan penting. Pada awal tahun 2025, seiring dengan semakin ketatnya persaingan untuk AI, Alibaba meluncurkan model AI Qwen2.5-max yang baru, dan DeepSeek, sebuah perusahaan dari Hangzhou, Tiongkok, meluncurkan model R1, yang merupakan puncak dari teknologi LLM. Deepseek R1 adalah model AI sumber terbuka yang telah menarik…

Uncategorized

Gemini 2.0 mendominasi tangga lagu, sementara DeepSeek V3 harganya melambung, dan lahirlah juara baru yang hemat biaya!

Olehzddeepseeker 8 Februari 20258 Februari 2025

Keluarga Google Gemini 2.0 akhirnya lengkap! Ia mendominasi tangga lagu segera setelah dirilis. Di tengah pengejaran dan blokade Deepseek, Qwen, dan o3, Google merilis tiga model sekaligus pagi ini: Gemini 2.0 Pro, Gemini 2.0 Flash, dan Gemini 2.0 Flash-Lite. Pada peringkat LMSYS model besar, Gemini…

Uncategorized

Paper-DeepSeek-R1: Mendorong Kemampuan Penalaran dalam LLM melalui Pembelajaran Penguatan

Olehdeepseeker 29 Januari 202529 Januari 2025

Abstrak Makalah ini memperkenalkan model penalaran generasi pertama DeepSeek: DeepSeek-R1-Nol dan DeepSeek-R1. DeepSeek-R1-Zero, yang dilatih melalui pembelajaran penguatan skala besar (RL) tanpa fine-tuning yang diawasi (SFT), menunjukkan kemampuan penalaran yang luar biasa. Melalui RL, secara alami mengembangkan perilaku penalaran yang kuat. Namun, RL menghadapi tantangan seperti keterbacaan yang buruk dan pencampuran bahasa. Untuk mengatasi masalah ini dan meningkatkan kinerja penalaran, DeepSeek-R1 dikembangkan,...

Uncategorized

DeepSeek telah merilis kode sumbernya, penjelasan rinci tentang FlashMLA

Olehzddeepseeker 24 Februari 202524 Februari 2025

Minggu lalu, DeepSeek mengumumkan akan membuka lima proyek sumber terbuka minggu depan: Netizen berkata, "Kali ini, OpenAI benar-benar hadir." Baru saja, proyek sumber terbuka pertama muncul, terkait dengan percepatan inferensi, FlashMLA: Alamat proyek sumber terbuka: DeepSeek FlashMLA Sudah menjadi sumber terbuka selama dua jam, dan Github sudah memiliki 2,7 ribu+ bintang: The…

Uncategorized

Pertarungan Empat Model Teratas! Ulasan Menunjukkan Seberapa Kuat Deepseek R1

Olehzddeepseeker 1 Juni 20251 Juni 2025

Selama beberapa hari terakhir, Deepseek-R1 0528 telah resmi menjadi open source. Di LiveCodeBench, kinerjanya hampir setara dengan o3 (tinggi) milik OpenAI; dalam uji benchmark multibahasa Aider, ia mampu bersaing dengan Claude Opus. Ketika diluncurkan di situs web resmi, kami segera menguji kemampuan front-end-nya dan menemukan bahwa kemampuan itu sangat…

Fitur

Pengalaman online

Dokumentasi API

Pengalaman dalam aplikasi klien

Pabrik Token SiliconCloud

Posting serupa

Tinggalkan Balasan Batalkan balasan