Primeiro lançamento! SiliconFlow X Huawei Cloud lançam conjuntamente serviços de inferência DeepSeek R1 e V3 baseados na Ascend Cloud!

DeepSeek-R1 e DeepSeek-V3 causaram uma sensação global desde seu lançamento de código aberto.

Eles são um presente da equipe do DeepSeek para toda a humanidade, e estamos sinceramente felizes pelo seu sucesso.

Após dias de trabalho árduo das equipes da Silicon Mobility e da Huawei Cloud, hoje também estamos dando aos usuários chineses um presente de Ano Novo Chinês: A plataforma de serviço de nuvem de modelo em larga escala SiliconCloud lançou o DeepSeek-V3 e o DeepSeek-R1, que são baseados no serviço de nuvem Ascend da Huawei Cloud.

Deve-se enfatizar que recebemos um grande apoio do DeepSeek e da Huawei Cloud, tanto na adaptação do DeepSeek-R1 & V3 no Ascend quanto no processo de lançamento de outros modelos anteriormente, e gostaríamos de agradecer profundamente e respeitar muito.

Índice

Recursos

Esses dois modelos lançados pelo SiliconCloud incluem principalmente cinco recursos principais:

Com base no serviço de nuvem Ascend da Huawei Cloud, lançamos o DeepSeek x Silicon Mobility x Serviço de inferência de modelo R1 e V3 da Huawei Cloud pela primeira vez.

Por meio da inovação conjunta entre as duas partes, e com o apoio do mecanismo de aceleração de inferência desenvolvido pela própria empresa, o modelo DeepSeek implantado pela equipe da Silicon Mobility com base no serviço de nuvem Ascend da Huawei Cloud pode alcançar o mesmo efeito que um modelo de implantação de GPU de ponta no mundo.

Fornecer serviços de inferência DeepSeek-R1 e V3 estáveis em nível de produção. Isso permite que os desenvolvedores executem de forma estável em ambientes de produção em larga escala e atendam às necessidades de implantação comercial. Os serviços de IA do Huawei Cloud Ascend fornecem potência de computação abundante, elástica e suficiente.

Não há limite de implementação, permitindo que os desenvolvedores se concentrem mais no desenvolvimento de aplicativos. Ao desenvolver aplicativos, eles podem chamar diretamente a API do SiliconCloud, o que proporciona uma experiência mais fácil e amigável.

O preço do DeepSeek-V3 no SiliconCloud durante o período de desconto oficial (até as 24:00 de 8 de fevereiro) é de ¥1 / M tokens (entrada) e ¥2 / M tokens (saída), e o preço do DeepSeek-R1 é de ¥4 / M tokens (entrada) e ¥16 / M tokens (saída).

Experiência on-line

DeepSeek-R1 com o SiliconCloud

DeepSeek-V3 com o SiliconCloud

Documentação da API

API

Os desenvolvedores podem experimentar o efeito do DeepSeek-R1 e V3 acelerado em chips domésticos no SiliconCloud. A velocidade de saída mais rápida ainda está sendo continuamente otimizada.

Experiência em aplicativos de clientes

Se quiser experimentar o modelo DeepSeek-R1 e V3 diretamente no aplicativo cliente, você pode instalar os seguintes produtos localmente e acessar a API do SiliconCloud (você pode personalizar e adicionar esses dois modelos) para experimentar o DeepSeek-R1 e V3.

Aplicativos de cliente de modelo grande: ChatBox, Estúdio Cherry, OneAPI, LobeChat, NextChat
Aplicativos de geração de código: Cursor, Windsurf, Cline
Plataforma de desenvolvimento de aplicativos de modelo grande:Dify
Base de conhecimento de IA:IA da ObsidianeFastGPT
Plug-in de tradução:Immersive Translate eEurodict

Para obter mais tutoriais de acesso a cenários e casos de aplicativos, consulte aqui

Fábrica de tokens SiliconCloud

Qwen2.5 (7B), etc. Mais de 20 modelos gratuitos para uso

Como uma plataforma completa de serviços em nuvem para modelos grandes, o SiliconCloud tem o compromisso de fornecer aos desenvolvedores APIs de modelos que sejam ultrarresponsivas, acessíveis, abrangentes e que tenham uma experiência suave.

Além do DeepSeek-R1 e do DeepSeek-V3, o SiliconCloud também lançou o Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

dezenas de grandes modelos de linguagem de código aberto, modelos de geração de imagem/vídeo, modelos de fala, modelos de código/matemática e modelos vetoriais e de reordenação.

A plataforma permite que os desenvolvedores comparem e combinem livremente grandes modelos de várias modalidades para escolher a melhor prática para seu aplicativo de IA generativa.

Entre elas, mais de 20 APIs de modelos grandes, como Qwen2.5 (7B) e Llama3.1 (8B), são de uso gratuito, permitindo que os desenvolvedores e gerentes de produtos obtenham "liberdade de token" sem se preocupar com o custo da capacidade de computação durante o estágio de pesquisa e desenvolvimento e a promoção em larga escala.

Publicações semelhantes

Sem categoria

DeepSeek lançou seu código fonte, explicação detalhada do FlashMLA

Porzddeepseeker 24 de fevereiro de 202524 de fevereiro de 2025

Na semana passada, o DeepSeek anunciou que disponibilizaria cinco projetos de código aberto na próxima semana: Os internautas disseram: "Desta vez, o OpenAI realmente está aqui". Agora mesmo, o primeiro projeto de código aberto chegou, relacionado à aceleração de inferência, FlashMLA: Endereço do projeto de código aberto: DeepSeek FlashMLA Ele está com código aberto há duas horas, e o Github já tem mais de 2,7 mil estrelas: O…

Sem categoria

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

A OpenAI lançou seu mais recente modelo de inferência, o o3-mini, que é otimizado para áreas como ciências, matemática e programação, oferecendo resposta mais rápida, maior precisão e menor custo. Em comparação com seu antecessor o1-mini, o o3-mini melhorou significativamente seus recursos de inferência, especialmente na solução de problemas complexos. Os testadores preferem as respostas do o3-mini por 56%, e a taxa de erro foi...

Sem categoria

Notícias de última hora! A OpenAI lançou hoje dois novos modelos de inferência: o3-mini e o3-mini-high.

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

O o3-mini e o o3-mini (high) serão lançados hoje. Os usuários comuns também receberão o o3-mini, e os usuários plus poderão usar o o3-mini (high). O o3-mini (high) é cerca de 200 pontos mais alto que o o1 no Codeforce, mais rápido que o o1 e tem melhor desempenho em codificação e matemática, mas o custo ainda está no nível do o1-mini....

Sem categoria

Altman: Estávamos errados sobre a IA de código aberto! O DeepSeek tornou o OpenAI menos vantajoso, e o próximo é o GPT-5

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

O o3-mini chegou tarde da noite, e a OpenAI finalmente revelou seu mais recente trunfo. Durante uma sessão de perguntas e respostas do Reddit AMA, Altman confessou profundamente que estava do lado errado da IA de código aberto. Ele disse que a estratégia interna de código aberto está sendo considerada, e o modelo continuará a ser desenvolvido, mas...

Sem categoria

O Confronto dos Quatro Melhores Modelos! Uma Análise Mostra o Poder do Deepseek R1

Porzddeepseeker 1 de junho de 20251 de junho de 2025

Nos últimos dias, o Deepseek-R1 0528 foi oficialmente disponibilizado como código aberto. No LiveCodeBench, seu desempenho está quase no mesmo nível do o3 (alto) da OpenAI; no teste de benchmark multilíngue da Aider, ele se compara ao Claude Opus. Quando foi lançado no site oficial, testamos rapidamente seus recursos de front-end e os consideramos excepcionalmente…

Sem categoria

Como o DeepSeek foi criado? Uma análise do histórico de crescimento do DeepSeek

Porzddeepseeker fevereiro 3, 2025fevereiro 3, 2025

No futuro, haverá cada vez mais inovações radicais. Pode não ser fácil de entender agora, porque todo o grupo social precisa ser educado por fatos. Quando essa sociedade permitir que as pessoas que inovam de forma radical tenham sucesso, a mentalidade coletiva mudará. Só precisamos de um monte de fatos e um processo....

Recursos

Experiência on-line

Documentação da API

Experiência em aplicativos de clientes

Fábrica de tokens SiliconCloud

Publicações semelhantes

Deixe um comentário Cancelar resposta