지난 며칠 동안 Deepseek-R1 0528이 공식적으로 오픈소스로 공개되었습니다. LiveCodeBench에서 해당 성능은 OpenAI의 o3(높음)과 거의 동등하며, Aider의 다국어 벤치마크 테스트에서는 Claude Opus와 견줄 만한 성능을 보였습니다. 공식 웹사이트에 출시된 후, 프런트엔드 기능을 빠르게 테스트해 본 결과, 매우 뛰어난 성능을 확인했습니다.
DeepSeek R1 모델은 마이너 버전 업그레이드를 거쳤으며, 현재 버전은 DeepSeek-R1-0528입니다. DeepSeek 웹페이지나 앱에 접속하시면 대화창에서 "딥 씽킹(Deep Thinking)" 기능을 활성화하여 최신 버전을 경험하실 수 있습니다. DeepSeek-R1-0528 모델의 무게는 HuggingFace에 업로드되었습니다. 지난 4개월 동안 DeepSeek-R1은…
지난주 DeepSeek는 다음 주에 5개의 프로젝트를 오픈소스화한다고 발표했습니다. 네티즌들은 "이번에는 OpenAI가 정말 왔어요."라고 말했습니다. 방금 첫 번째 오픈소스 프로젝트가 나왔는데, 추론 가속과 관련된 FlashMLA입니다. 오픈소스 프로젝트 주소: DeepSeek FlashMLA 오픈소스화 된 지 2시간 되었고, Github은 이미 2.7k+개의 별을 받았습니다. The…
FlashMLA는 특히 대규모 언어 모델(LLM) 분야에서 인공 지능 분야에서 빠르게 주목을 받고 있습니다. DeepSeek에서 개발한 이 혁신적인 도구는 AI 계산에 일반적으로 사용되는 고성능 칩인 Hopper GPU를 위해 설계된 최적화된 디코딩 커널 역할을 합니다. FlashMLA는 가변 길이 시퀀스의 효율적인 처리에 중점을 두고 있어 특히…