OpenAI가 최신 추론 모델을 출시했습니다, o3-mini과학, 수학, 프로그래밍 등의 분야에 최적화되어 더 빠른 응답, 더 높은 정확도, 더 낮은 비용을 제공합니다.
이전 버전인 o1-mini에 비해 추론 능력, 특히 복잡한 문제 해결 능력이 크게 향상되었습니다. 테스터들은 o3-mini의 정답을 56% 더 선호하며, 오류율은 39% 감소했습니다. 오늘부터 ChatGPT Plus, 팀 그리고 Pro 사용자는 o3-mini를 사용할 수 있으며 무료 사용자 의 일부 기능도 체험할 수 있습니다.

추론 모델과 비교 DeepSeek-R1얼마나 더 나은지 OpenAI o3-mini R1보다?
이 기사에서는 먼저 o3-mini의 주요 특징에 대한 개요를 살펴본 다음 각 벤치마크의 양쪽 데이터를 추출하여 시각적으로 비교할 수 있는 그래프를 만들 것입니다. 또한 o3-mini의 가격도 비교하겠습니다.
핵심 하이라이트
1.STEM 최적화수학, 프로그래밍, 과학 등의 분야에서 뛰어나며 특히 고난도 추론 노력 모드에서 o1-mini를 능가합니다.
2.개발자 기능는 프로덕션 환경의 요구 사항을 충족하기 위해 함수 호출, 구조화된 출력 및 개발자 메시지와 같은 기능을 지원합니다.
3.빠른 응답요청당 7.7초의 응답 시간으로 o1-mini보다 24% 더 빠릅니다.
4.보안 개선딥 얼라인먼트 기술을 통해 안전하고 안정적인 출력을 보장합니다.
5.비용 효율적추론 기능과 비용 최적화가 함께 제공되어 AI 사용의 문턱을 크게 낮춥니다.
비교
개방형 AI 클래스를 강조하기 위해 공식 블로그 는 자체 모델과만 비교하고 있습니다. 따라서 이 글은 DeepSeek R1 논문과 공식 OpenAI 블로그의 데이터에서 발췌한 표입니다.
OpenAI는 공식적으로 다음을 비교합니다. o3-mini 를 버전 목록에 추가하여 추론 강도를 나타내는 낮음, 중간, 높음 세 가지 버전으로 분류합니다. DeepSeek는 Math-500을 사용하고 OpenAI는 Math 데이터 세트를 사용하므로 여기서는 이 비교를 제거했습니다.

차트가 더 직관적이며, 값이 너무 커서 직관적으로 표시하기 어렵다는 이유로 Codeforces는 제거되었습니다. 그러나 Codeforces를 비교해보면 o3-mini의 높은 추론 강도가 크게 앞서지 않는다는 것을 알 수 있습니다.

↑1AIME2024→2GPQA 다이아몬드→3MMLU→4SWE-벤치-검증 완료
차트를 보면 총 4개의 비교가 있으며, 일반적으로 O3-mini(높음)가 앞서지만 그 차이는 매우 작습니다.
가격
모델 | 입력 가격 | 캐시 히트 | 출력 가격 |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
요약
DeepSeek R1가 미국에서 DeepSeek 패닉을 촉발하면서 가장 먼저 위협을 느낀 것은 OpenAI였으며, 특히 새 모델인 o3-mini의 가격 책정에서 이를 잘 알 수 있습니다.
Openai o1이 처음 출시되었을 때, 높은 가격은 많은 개발자와 사용자에게 부담을 주었습니다. DeepSeek R1의 등장으로 모두에게 더 많은 선택권이 주어졌습니다.o1과 R1의 30배 가격 차이에서 o3-mini의 최종 가격은 두 배입니다. DeepSeek R1의 가격입니다,
는 DeepSeek R1가 오픈아이에 미치는 영향을 보여줍니다.단, ChatGPT 무료 사용자는 o3-mini를 제한된 방식으로만 체험할 수 있으며, DeepSeek의 딥씽킹은 현재 모든 사용자가 이용할 수 있습니다.또한, 사용자의 사용 비용을 줄이면서 더 많은 선도적인 AI 모델을 제공하는 오픈AI가 되기를 기대합니다.
R1을 사용해본 블로거의 개인적인 경험으로 볼 때, R1의 딥씽킹은 항상 제 마음을 열어준다고 말하고 싶습니다. 여러분도 문제에 대해 생각할 때 더 많이 사용해보시길 추천합니다.