첫 출시! 실리콘플로우 X 화웨이 클라우드, 어센드 클라우드 기반 DeepSeek R1 및 V3 추론 서비스 공동 출시!

DeepSeek-R1 와 DeepSeek-V3는 오픈 소스 출시 이후 전 세계적으로 센세이션을 일으켰습니다.

DeepSeek 팀이 모든 인류에게 주는 선물이며, 저희는 그들의 성공을 진심으로 축하합니다.

실리콘 모빌리티와 화웨이 클라우드 팀의 며칠간의 노력 끝에, 오늘 중국 사용자들에게도 춘절 선물을 드립니다: 대규모 모델 클라우드 서비스 플랫폼인 실리콘클라우드가 화웨이 클라우드의 어센드 클라우드 서비스를 기반으로 하는 DeepSeek-V3 및 DeepSeek-R1을 출시했습니다.

DeepSeek-R1 및 V3를 Ascend에 적용하는 과정과 이전에 다른 모델을 출시하는 과정에서 DeepSeek와 화웨이 클라우드의 큰 지원을 받았음을 강조하며, 깊은 감사와 존경의 마음을 전합니다.

특징

실리콘클라우드가 출시한 이 두 모델은 크게 다섯 가지 주요 기능을 제공합니다:

화웨이 클라우드의 어센드 클라우드 서비스를 기반으로 다음과 같이 출시했습니다. DeepSeek x 실리콘 모빌리티 x 화웨이 클라우드 R1 및 V3 모델 추론 서비스를 최초로 도입했습니다.

양사 간의 공동 혁신과 자체 개발한 추론 가속 엔진의 지원을 통해, 화웨이 클라우드의 어센드 클라우드 서비스를 기반으로 실리콘 모빌리티 팀이 배포한 DeepSeek 모델은 전 세계 하이엔드 GPU 배포 모델과 동일한 효과를 얻을 수 있습니다.

안정적인 프로덕션 수준의 DeepSeek-R1 및 V3 추론 서비스를 제공합니다. 이를 통해 개발자는 대규모 프로덕션 환경에서 안정적으로 실행하고 상용 배포의 요구 사항을 충족할 수 있습니다. 화웨이 클라우드 어센드 AI 서비스는 풍부하고 탄력적이며 충분한 컴퓨팅 성능을 제공합니다.

배포 임계값이 없으므로 개발자는 애플리케이션 개발에 더 집중할 수 있습니다. 애플리케이션을 개발할 때 SiliconCloud API를 직접 호출할 수 있어 더욱 쉽고 사용자 친화적인 환경을 제공합니다.

공식 할인 기간(2월 8일 24시까지) 동안 실리콘클라우드의 DeepSeek-V3 가격은 1M 토큰(입력) 1엔, 2M 토큰(출력)이며, DeepSeek-R1 가격은 4M 토큰(입력) 16엔, 2M 토큰(출력)입니다.

온라인 경험

DeepSeek-R1 실리콘클라우드

DeepSeek-V3 실리콘클라우드

API 문서

API

개발자는 실리콘클라우드에서 국내 칩에서 가속화된 DeepSeek-R1 및 V3의 효과를 경험할 수 있습니다. 더 빠른 출력 속도는 계속 최적화되고 있습니다.

클라이언트 애플리케이션 사용 경험

클라이언트 애플리케이션에서 DeepSeek-R1 및 V3 모델을 직접 체험하려면 다음 제품을 로컬에 설치하고 SiliconCloud API(이 두 모델을 사용자 지정하고 추가할 수 있음)에 액세스하여 DeepSeek-R1 및 V3를 체험할 수 있습니다.

대형 모델 클라이언트 애플리케이션: 채팅박스, 체리 스튜디오, OneAPI, 로브챗, 넥스트챗
코드 생성 애플리케이션: 커서, 윈드서핑, 클라인
대규모 모델 애플리케이션 개발 플랫폼:Dify
AI 지식창고:옵시디언 AI및FastGPT
번역 플러그인:몰입형 번역 및 유로딕트

더 많은 시나리오 및 애플리케이션 사례 액세스 자습서를 보려면 다음을 참조하세요. 여기

토큰 팩토리 실리콘클라우드

Qwen2.5(7B) 등 20개 이상의 모델 무료 사용

대규모 모델을 위한 원스톱 클라우드 서비스 플랫폼인 SiliconCloud는 개발자에게 응답성이 뛰어나고 저렴하며 포괄적이고 매끄러운 경험을 제공하는 모델 API를 제공하기 위해 최선을 다하고 있습니다.

실리콘클라우드는 DeepSeek-R1 및 DeepSeek-V3 외에도 Janus-Pro-7B, CosyVoice2, QVQ-72B-Preview, DeepSeek-VL2, DeepSeek-V2.5-1210, Llama-3.3-70B-Instruct, HunyuanVideo, fish-speech-1.5, Qwen2.5 -7B/14B/32B/72B, FLUX.1도 출시했습니다, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat,

수십 개의 오픈 소스 대규모 언어 모델, 이미지/비디오 생성 모델, 음성 모델, 코드/수학 모델, 벡터 및 재주문 모델 등을 지원합니다.

이 플랫폼을 통해 개발자는 다양한 양식의 대규모 모델을 자유롭게 비교하고 결합하여 제너레이티브 AI 애플리케이션에 적합한 모범 사례를 선택할 수 있습니다.

그 중 Qwen2.5(7B), Llama3.1(8B) 등 20개 이상의 대형 모델 API를 무료로 사용할 수 있어 개발자와 제품 관리자는 연구 개발 단계와 대규모 프로모션에서 컴퓨팅 파워 비용 걱정 없이 "토큰 프리"를 실현할 수 있습니다.

유사한 게시물

분류

Ali Qwen2.5-Max가 DeepSeek-V3를 추월! 네티즌: 중국의 AI가 격차를 빠르게 줄이고 있다

으로zddeepseeker 2월 5, 20252월 5, 2025

방금 알리의 빅모델 아레나에 국내 모델이 하나 더 추가되었는데, Qwen2.5-Max가 DeepSeek-V3를 제치고 전체 랭킹 7위에 올랐으며 총점 1332점을 기록했습니다. 또한 Claude 3.5 Sonnet과 Llama 3.1 405B와 같은 모델도 단번에 제쳤습니다. 특히 프로그래밍에서 탁월합니다…

분류

DeepSeek-R1 기술 공개: 논문의 핵심 원리가 분석되고 획기적인 모델 성능의 핵심이 밝혀짐

으로zddeepseeker 2월 9, 20252월 9, 2025

오늘은 DeepSeek R1를 공유하겠습니다. 제목: DeepSeek-R1: 강화 학습을 통한 LLM의 추론 능력에 인센티브 제공: 강화 학습을 통한 LLM의 추론 능력에 인센티브 제공. 이 논문은 DeepSeek의 1세대 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다. DeepSeek-R1-Zero 모델은 초기 단계로 감독 미세 조정(SFT) 없이 대규모 강화 학습(RL)을 통해 학습되었습니다.

분류

DeepSeek TOP17 최고의 대안: 종합 분석(2025)

으로deepseeker 2월 6, 20252월 6, 2025

소개 빠르게 진화하는 인공지능 환경에서 DeepSeek는 강력한 언어 모델로 부상했습니다. 이 포괄적인 분석은 DeepSeek의 상위 17개 대안을 살펴보고 고유한 기능, 역량 및 사용 사례를 검토합니다. 저희 연구는 DeepSeek 통합 또는 유사한 역량을 제공하는 국제 및 중국 플랫폼에 중점을 둡니다. 상위 대안 분석 1….

분류

FlashMLA란 무엇인가? AI 디코딩 커널에 미치는 영향에 대한 포괄적인 가이드

으로deepseeker 2월 24, 20252월 24, 2025

FlashMLA는 특히 대규모 언어 모델(LLM) 분야에서 인공 지능 분야에서 빠르게 주목을 받고 있습니다. DeepSeek에서 개발한 이 혁신적인 도구는 AI 계산에 일반적으로 사용되는 고성능 칩인 Hopper GPU를 위해 설계된 최적화된 디코딩 커널 역할을 합니다. FlashMLA는 가변 길이 시퀀스의 효율적인 처리에 중점을 두고 있어 특히…

분류

DeepSeek는 어떻게 만들어졌나요? DeepSeek의 성장 스토리 분석

으로zddeepseeker 2월 3, 20252월 3, 2025

앞으로는 점점 더 하드코어한 혁신이 일어날 것입니다. 사회 전체가 사실에 기반한 교육을 받아야 하기 때문에 지금은 이해하기 쉽지 않을 수 있습니다. 이 사회가 하드코어 혁신을 하는 사람들이 성공할 수 있도록 허용하면 집단적 사고방식이 바뀔 것입니다. 우리는 많은 사실과 프로세스가 필요합니다....

분류

인공지능계에서는 DeepSeek R1가 실제 테스트에서 꾸준히 o1과 클로드의 성능을 뛰어넘으며 RL의 황금기에 접어들었습니다.

으로zddeepseeker 2월 1, 20252월 1, 2025

2025년 AI 분야의 시작이 이렇게 될 줄은 아무도 예상하지 못했습니다. DeepSeek R1는 정말 놀랍습니다! 최근 '신비한 동양의 힘' DeepSeek가 실리콘밸리를 '하드 컨트롤'하고 있습니다. 저는 R1에게 피타고라스의 정리를 자세히 설명해달라고 부탁했습니다. 이 모든 것을 인공지능이 30초도 안 되는 시간 안에 해냈습니다.

특징

온라인 경험

API 문서

클라이언트 애플리케이션 사용 경험

토큰 팩토리 실리콘클라우드

유사한 게시물

답글 남기기 응답 취소