zddeepseeker - Deepseek R1 - 3 / 2 페이지

분류

DeepSeek-R1 기술 공개: 논문의 핵심 원리가 분석되고 획기적인 모델 성능의 핵심이 밝혀짐

으로zddeepseeker 2월 9, 20252월 9, 2025

오늘은 DeepSeek R1를 공유하겠습니다. 제목: DeepSeek-R1: 강화 학습을 통한 LLM의 추론 능력에 인센티브 제공: 강화 학습을 통한 LLM의 추론 능력에 인센티브 제공. 이 논문은 DeepSeek의 1세대 추론 모델인 DeepSeek-R1-Zero와 DeepSeek-R1을 소개합니다. DeepSeek-R1-Zero 모델은 초기 단계로 감독 미세 조정(SFT) 없이 대규모 강화 학습(RL)을 통해 학습되었습니다.

분류

DeepSeek R1 논문 해석 및 핵심 기술 사항

으로zddeepseeker 2월 9, 20252월 9, 2025

1 배경 춘절 기간 동안 DeepSeek R1는 다시 한번 광범위한 주목을 받았고, 이전에 쓴 DeepSeek V3 해석 기사도 재전송되어 많은 논의를 받았습니다. DeepSeek R1에 대한 많은 분석과 재현이 있었지만, 여기서는 해당 독서 노트를 정리하기로 했습니다. 우리는 세 가지를 사용할 것입니다…

구글의 저비용 모델인 제미니 2.0 시리즈가 공격에 나선다. 대형 모델에서 비용 효율성 경쟁이 치열해지고 있다.

분류

구글의 저비용 모델인 제미니 2.0 시리즈가 공격에 나선다. 대형 모델에서 비용 효율성 경쟁이 치열해지고 있다.

으로zddeepseeker 2월 8, 20252월 8, 2025

대규모 AI 모델을 사용하는 데 드는 높은 비용은 많은 AI 애플리케이션이 아직 구현 및 홍보되지 않은 주요 이유입니다. 극한의 성능을 선택하면 엄청난 컴퓨팅 전력 비용이 발생하여 일반 사용자가 감당할 수 없는 높은 사용 비용이 발생합니다. 대규모 AI 모델에 대한 경쟁은 연기 없는 전쟁과 같습니다. 그 후…

Gemini 2.0이 차트를 장악하고 있고, DeepSeek V3는 가격이 비쌉니다. 그리고 새로운 비용 효율적인 챔피언이 탄생했습니다!

분류

Gemini 2.0이 차트를 장악하고 있고, DeepSeek V3는 가격이 비쌉니다. 그리고 새로운 비용 효율적인 챔피언이 탄생했습니다!

으로zddeepseeker 2월 8, 20252월 8, 2025

Google Gemini 2.0 제품군이 마침내 완성되었습니다! 출시되자마자 차트를 장악했습니다. Deepseek, Qwen, o3의 추적과 봉쇄 속에서 Google은 오늘 아침 일찍 Gemini 2.0 Pro, Gemini 2.0 Flash, Gemini 2.0 Flash-Lite의 세 가지 모델을 한꺼번에 출시했습니다. 대형 모델 LMSYS 순위에서 Gemini…

a16z, 27세 CEO와 대화: AI 에이전트는 레버리지 효과가 크고 장기적으로는 노동비에 연동될 것

분류

a16z, 27세 CEO와 대화: AI 에이전트는 레버리지 효과가 크고 장기적으로는 노동비에 연동될 것

으로zddeepseeker 2월 8, 20252월 8, 2025

하이라이트 AI 에이전트가 고객 경험을 재구성합니다 제시 장: 에이전트는 실제로 어떻게 구성됩니까? 시간이 지남에 따라 자연어 기반 에이전트와 점점 더 비슷해질 것이라고 생각합니다. 대규모 언어 모델(LLM)이 그렇게 훈련되기 때문입니다. 장기적으로, 만약 당신이 매우 지적인 에이전트를 가지고 있다면…

분류

캐시 우드: DeepSeek는 단지 비용 절감 과정을 가속화하는 것일 뿐입니다. 대공황과 비교할 수 있는 극도로 집중된 시장 구조가 변화할 것입니다.

으로zddeepseeker 2월 8, 20252월 8, 2025

하이라이트 DeepSeek와의 경쟁은 미국에 좋다 캐시 우드: 혁신 비용이 극적으로 떨어지고 있으며, 이러한 추세가 이미 시작되었다는 것을 보여준다고 생각합니다. 예를 들어, DeepSeek 이전에는 인공 지능을 훈련하는 비용이 연간 75% 감소했고, 추론 비용은 85% 감소하여…

분류

Google은 세 가지 새로운 모델을 한꺼번에 출시했습니다. Gemini-2.0-Pro는 무료이며, 뛰어난 점수를 받아 1위를 차지했으며, 복잡한 프롬프트를 코딩하고 처리하는 데 적합합니다!

으로zddeepseeker 2월 8, 20252월 8, 2025

Gemini 2.0의 스토리가 가속화되고 있습니다. 12월의 Flash Thinking Experimental 버전은 개발자에게 낮은 지연 시간과 높은 성능을 갖춘 작동 모델을 제공했습니다. 올해 초, 2.0 Flash Thinking Experimental은 Google AI Studio에서 업데이트되어 Flash의 속도와 향상된 추론 기능을 결합하여 성능을 더욱 개선했습니다. 지난주,…

분류

Ali Qwen2.5-Max가 DeepSeek-V3를 추월! 네티즌: 중국의 AI가 격차를 빠르게 줄이고 있다

으로zddeepseeker 2월 5, 20252월 5, 2025

방금 알리의 빅모델 아레나에 국내 모델이 하나 더 추가되었는데, Qwen2.5-Max가 DeepSeek-V3를 제치고 전체 랭킹 7위에 올랐으며 총점 1332점을 기록했습니다. 또한 Claude 3.5 Sonnet과 Llama 3.1 405B와 같은 모델도 단번에 제쳤습니다. 특히 프로그래밍에서 탁월합니다…

속보! DeepSeek 연구원이 온라인에서 밝힘: R1 훈련은 2~3주 밖에 걸리지 않았고, 중국 설날 연휴 동안 R1 제로의 강력한 진화가 관찰되었습니다.

분류

속보! DeepSeek 연구원이 온라인에서 밝힘: R1 훈련은 2~3주 밖에 걸리지 않았고, 중국 설날 연휴 동안 R1 제로의 강력한 진화가 관찰되었습니다.

으로zddeepseeker 2월 4, 20252월 4, 2025

속보! DeepSeek 연구원이 온라인에 공개: R1 훈련은 2~3주밖에 걸리지 않았고, 중국 설 연휴 동안 R1 제로의 강력한 진화가 관찰되었습니다. 방금 DeepSeek 연구원 다야 궈가 DeepSeek R1와 회사의 향후 계획에 대한 네티즌의 질문에 답한 것을 보았습니다. 우리는 이렇게만 말할 수 있습니다...

DeepSeek R1는 창의적 글쓰기 테스트에서 1등을 차지했고, o3 미니는 o1 미니보다 더 나빴습니다!

분류

DeepSeek R1는 창의적 글쓰기 테스트에서 1등을 차지했고, o3 미니는 o1 미니보다 더 나빴습니다!

으로zddeepseeker 2월 3, 20252월 3, 2025

DeepSeek R1가 창작 단편소설 쓰기 벤치마크 테스트에서 기존의 우승자인 Claude 3.5 Sonnet을 제치고 우승을 차지했습니다! 벤치마크 테스트 연구원 레흐 마주르가 설계한 벤치마크 테스트는 일반적인 글쓰기 대회와는 다릅니다. 각 AI 모델은 500개의 단편 소설을 완성해야 했고, 각 소설에는 다음과 같은 요소를 교묘하게 통합해야 했습니다.