Gemini 2.0이 차트를 장악하고, DeepSeek V3는 가격에서 울부짖으며, 새로운 비용 효율적인 챔피언이 탄생했습니다!

그리고 구글 제미니 2.0 패밀리가 드디어 완성되었습니다! 발매되자마자 차트를 장악했습니다.

추적과 봉쇄 속에서 Deepseek, Qwen과 o3, Google은 오늘 이른 아침에 Gemini 2.0 Pro, Gemini 2.0 Flash, Gemini 2.0 Flash-Lite의 세 가지 모델을 한꺼번에 출시했습니다.

대형 모델 LMSYS 순위에서는 Gemini 2.0-Pro가 정상에 올랐고, Gemini-2.0 제품군은 모두 상위 10위 안에 진입했습니다.

먼저 모델 성능을 살펴보자

그리고 제미니 2.0 모델 이번에 출시된 모든 제품은 성능 면에서 각자의 하이라이트를 가지고 있습니다.!

Gemini 2.0 Pro(실험적)

로서 플래그십 모델 Gemini 시리즈 중 Pro 버전은 Google의 가장 진보된 AI 기능을 나타내며 다음과 같은 측면에서 탁월합니다. 코딩 및 추론 특히:

매우 큰 컨텍스트 창: 최대 컨텍스트 처리 지원 2M 토큰
강력한 도구 통합: Google 검색과 코드 실행을 긴밀하게 통합합니다.
유효성: Google AI Studio, Vertex AI 및 Gemini Advanced 플랫폼에서 실험 버전으로 이미 제공됨

제미니 2.0 플래시

로 위치 지정됨 "고효율의 워크호스". 속도와 성능의 균형을 맞추는 데 중점을 두고 설계되었으며, 저지연 응답이 필요한 애플리케이션 시나리오에 이상적인 지원을 제공하도록 의도되었습니다.

수백만 개의 컨텍스트 창: 1M 토큰 컨텍스트 지원
뛰어난 다중 모드 추론 기능: 멀티모달 데이터 처리에 능숙하며 현재 멀티모달 입력 및 단일 모달 텍스트 입력을 지원합니다.
향후 기능 확장: 이미지 생성 및 텍스트 음성 변환 기능이 곧 제공될 예정입니다.
유효성: Vertex AI Studio 및 Google AI Studio 플랫폼에서 공식 출시되었으며, Gemini API를 통해 액세스할 수 있습니다.

Gemini 2.0 플래시라이트(미리보기)

"가장 비용 효율적인" 모델인 Flash-Lite는 속도, 비용, 성능 간의 최적의 균형을 제공합니다.

비용 효율성의 장점: 1.5 플래시와 동일한 속도와 비용을 유지하면서도 대부분 벤치마크 테스트에서 1.5 플래시보다 우수한 성능을 보입니다.
백만 레벨 컨텍스트 창: 또한 1M 토큰의 컨텍스트 처리 능력을 지원합니다.

Google에서 공개한 성능 평가 비교에 따르면 Gemini 2.0 Pro Experimental 버전은 거의 모든 벤치마크 테스트에서 가장 높은 점수를 달성하며 뛰어난 성능을 보였습니다.

특히 코드 생성 작업(예: LiveCodeBench v5)과 복잡한 수학 문제(예: 대수, 기하학 및 미적분)에서 좋은 성과를 보였습니다. 또한 복잡한 긴 문서 이해 테스트에서도 상당한 개선이 있었습니다.

그리고 가격

구글은 API 비용 효율성 측면에서도 양심적인 제조업체입니다.

Gemini 2.0 Flash의 백만 토큰은 1달러도 안 됩니다. 다양한 모드, 네트워크 검색, 전례 없는 컨텍스트 창을 지원합니다.

이와 대조적으로, Deepseek V3는 현재 토큰 100만 개당 1달러이고, R1 추론은 4달러입니다.

PS: 하지만 저는 여전히 DeepSeek에게 가격을 낮춰준 것에 감사하고 싶습니다. 가격을 낮출 수 있는 사람은 가족입니다.

이거 진짜 너무 싸네요! 성능에 비하면 제미니가 간과한 건 가격인 것 같아요!

케이스 성능

Deepseek만큼 좋다고 주장하기 때문에 실제로 어떤 성능을 보이는지, 다양한 네티즌들이 어떻게 테스트했는지 꼭 확인해야 합니다.

물리 기반 핀볼 게임

먼저, 충돌, 마찰, 중력 등의 현실적인 효과를 시뮬레이션하기 위해 물리 엔진을 사용하는 이 인기 있는 사례를 살펴보겠습니다.

힌트: 회전하는 육각형 안에서 튀는 공을 표시하는 Python 프로그램을 작성하세요. 공은 중력과 마찰의 영향을 받아야 하며, 회전하는 벽에서 현실적으로 튀겨야 합니다.

Deepseek R1 및 o3-min의 성능은 다음과 같습니다.

Gemini 2.0 Pro Experimental에서 생성된 버전:

나머지 두 모델은 성능이 좋지 않습니다.

난이도를 두 배로 높이세요! 공을 100개의 공으로 나누세요!

힌트: 구 안에 밝은 노란색 공 100개가 튀는 스크립트를 작성하고 충돌 감지를 올바르게 처리하세요. 구를 천천히 회전시키세요. 공이 구 안에 있는지 확인하세요. p5.js에서 구현하세요.

잘 하셨습니다! 구의 느린 회전이 매우 부드럽고 물리 법칙의 시뮬레이션이 훌륭합니다. 100개의 공도 꾸준히 충돌하며 "제 역할을 다하고 있습니다" ~

원통형 용기 안의 진공 공간에서 튀는 25개의 입자를 시뮬레이션하는 p5.js 스크립트를 작성합니다. 각 공에 다른 색상을 사용하고 움직임을 보여주는 흔적을 남기도록 합니다. 용기의 느린 회전을 추가하여 장면에서 무슨 일이 일어나는지 더 잘 관찰합니다. 입자가 용기 안에 남아 있도록 적절한 충돌 감지 및 물리 규칙을 만듭니다. 외부 구형 용기를 추가합니다. 전체 장면에 느린 확대 및 축소 효과를 추가합니다.

넘을 수 없는 딸기 테스트 문제

그리고 영리한(교활한) 네티즌들은 고전적인 딸기 테스트를 다시 꺼냈습니다.

딸기에는 r이 몇개 있나요?

그리고 Gemini 2.0 Flash Thinking Experimental이 정답을 맞혔습니다.

구글 사장 제프 딘이 자신의 프로그래밍 기술을 직접 테스트했다.

Google DeepMind와 Google Research의 수석 과학자 Jeff Dean도 Gemini 2.0 Pro의 프로그래밍 기술을 테스트했습니다.

그는 모델이 고전적인 Boggle 게임을 완성하도록 했고, 처음으로 생성된 코드는 모든 유효한 단어를 찾는 것을 완료했습니다. “편지 사각형” 게임:

게다가 제프 딘은 코드가 단 18.9초 만에 완성되었다고 말했는데, 이는 매우 빠른 속도라고 말했습니다.

Google DeepMind의 CEO는 이 모델의 주요 업데이트에 대해 확신을 갖고 있으며, 이 릴리스가 Google이 미래의 지능형 에이전트 작업을 달성하기 위한 기반을 마련한다고 말했습니다.

Google CEO Sundar Pichai는 이전에 2025년이 Google이 AI 분야 개발을 가속화하는 데 중요한 시기가 될 것이라고 분명히 밝혔습니다. 이번 출시 이후, 구글의 방향이 더욱 명확해졌습니다!

다른 거대 기업들의 경로와 비교했을 때 구글의 AI 경로는 실용성에 더 중점을 두고 다양한 버전 옵션을 직접 제공합니다., 마치 사용자의 필요에 따라 원하는 대로 선택할 수 있는 AI 툴박스로, 유연하고 편리합니다.모든 종류의 요구 사항을 충족할 수 있습니다.

Gemini 2.0이 차트를 장악하고 있고, DeepSeek V3는 가격이 비쌉니다. 그리고 새로운 비용 효율적인 챔피언이 탄생했습니다!