블로그

  • 상위 4개 모델의 대결! Deepseek R1의 강력한 성능을 보여주는 리뷰
    지난 며칠 동안 Deepseek-R1 0528이 공식적으로 오픈소스로 공개되었습니다. LiveCodeBench에서 해당 성능은 OpenAI의 o3(높음)과 거의 동등하며, Aider의 다국어 벤치마크 테스트에서는 Claude Opus와 견줄 만한 성능을 보였습니다. 공식 웹사이트에 출시된 후, 프런트엔드 기능을 빠르게 테스트해 본 결과, 매우 뛰어난 성능을 확인했습니다.
  • DeepSeek-R1-0528 업데이트: 더 깊은 사고, 더 강력한 추론
    DeepSeek R1 모델은 마이너 버전 업그레이드를 거쳤으며, 현재 버전은 DeepSeek-R1-0528입니다. DeepSeek 웹페이지나 앱에 접속하시면 대화창에서 "딥 씽킹(Deep Thinking)" 기능을 활성화하여 최신 버전을 경험하실 수 있습니다. DeepSeek-R1-0528 모델의 무게는 HuggingFace에 업로드되었습니다. 지난 4개월 동안 DeepSeek-R1은…
  • DeepSeek가 FlashMLA의 소스코드와 자세한 설명을 공개했습니다.
    지난주 DeepSeek는 다음 주에 5개의 프로젝트를 오픈소스화한다고 발표했습니다. 네티즌들은 "이번에는 OpenAI가 정말 왔어요."라고 말했습니다. 방금 첫 번째 오픈소스 프로젝트가 나왔는데, 추론 가속과 관련된 FlashMLA입니다. 오픈소스 프로젝트 주소: DeepSeek FlashMLA 오픈소스화 된 지 2시간 되었고, Github은 이미 2.7k+개의 별을 받았습니다. The…
  • FlashMLA란 무엇인가? AI 디코딩 커널에 미치는 영향에 대한 포괄적인 가이드
    FlashMLA는 특히 대규모 언어 모델(LLM) 분야에서 인공 지능 분야에서 빠르게 주목을 받고 있습니다. DeepSeek에서 개발한 이 혁신적인 도구는 AI 계산에 일반적으로 사용되는 고성능 칩인 Hopper GPU를 위해 설계된 최적화된 디코딩 커널 역할을 합니다. FlashMLA는 가변 길이 시퀀스의 효율적인 처리에 중점을 두고 있어 특히…

지금 바로 무료 계정을 만드세요!