So sánh toàn diện giữa o3-mini mới phát hành của OpenAI và DeepSeek R1

OpenAI đã phát hành mô hình suy luận mới nhất của mình, o3-mini, được tối ưu hóa cho các lĩnh vực như khoa học, toán học và lập trình, cung cấp phản hồi nhanh hơn, độ chính xác cao hơn và chi phí thấp hơn.

So với phiên bản tiền nhiệm o1-mini, o3-mini đã cải thiện đáng kể khả năng suy luận của mình, đặc biệt là trong việc giải quyết các vấn đề phức tạp. Người kiểm tra thích câu trả lời của o3-mini là 56% và tỷ lệ lỗi đã giảm 39%. Từ hôm nay, ChatGPT Plus, Nhóm Và Chuyên nghiệp người dùng có thể sử dụng o3-mini và người dùng miễn phí cũng có thể trải nghiệm một số tính năng của nó.

So sánh với mô hình suy luận DeepSeek-R1, tốt hơn bao nhiêu là OpenAI o3-mini hơn R1?

Bài viết này trước tiên sẽ cung cấp tổng quan về các điểm nổi bật của o3-mini, sau đó chúng tôi sẽ trích xuất dữ liệu từ cả hai phía trên mỗi điểm chuẩn và tạo biểu đồ để so sánh trực quan. Ngoài ra, chúng tôi cũng sẽ so sánh giá của o3-mini.

Mục lục

Điểm nổi bật cốt lõi

1.Tối ưu hóa STEM: vượt trội trong các lĩnh vực toán học, lập trình, khoa học, v.v., đặc biệt vượt trội hơn o1-mini ở chế độ nỗ lực suy luận cao.

2.Chức năng của nhà phát triển: hỗ trợ các chức năng như gọi hàm, đầu ra có cấu trúc và tin nhắn cho nhà phát triển để đáp ứng nhu cầu của môi trường sản xuất.

3.Phản ứng nhanh: 24% nhanh hơn o1-mini, với thời gian phản hồi là 7,7 giây cho mỗi yêu cầu.

4.Cải thiện bảo mật: đảm bảo đầu ra an toàn và đáng tin cậy thông qua công nghệ căn chỉnh sâu.

5.Tiết kiệm chi phí: khả năng suy luận và tối ưu hóa chi phí song hành với nhau, giúp giảm đáng kể ngưỡng sử dụng AI.

So sánh

AI mở Để làm nổi bật đẳng cấp của nó, blog chính thức chỉ so sánh nó với các mô hình của riêng nó. Do đó, bài viết này là một bảng được trích xuất từ bài báo DeepSeek R1 và dữ liệu từ blog chính thức của OpenAI.

OpenAI chính thức so sánh o3-mini trong danh sách phiên bản, chia thành ba phiên bản: thấp, trung bình và cao, biểu thị sức mạnh suy luận. Vì DeepSeek sử dụng Math-500 và OpenAI sử dụng tập dữ liệu Math, nên phép so sánh này đã bị xóa ở đây.

Biểu đồ trực quan hơn và Codeforces đã bị xóa vì các giá trị quá lớn để hiển thị trực quan. Tuy nhiên, so sánh trên Codeforces cho thấy sức mạnh suy luận cao của o3-mini không phải là một lợi thế lớn.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Đã xác minh

Từ biểu đồ, có tổng cộng 4 phép so sánh và O3-mini (cao) thường dẫn đầu, nhưng khoảng cách dẫn trước rất nhỏ.

Giá

người mẫu	Giá đầu vào	Bộ nhớ đệm hit	Giá đầu ra
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Tìm kiếm sâu R1	$0.55	$0.14	$2.19

Bản tóm tắt

Khi DeepSeek R1 gây ra sự hoảng loạn cho DeepSeek tại Hoa Kỳ, công ty đầu tiên cảm thấy bị đe dọa là OpenAI, điều này đặc biệt rõ ràng ở giá của mẫu o3-mini mới của công ty.

Khi Openai o1 lần đầu tiên được phát hành, mức giá cao của nó đã gây áp lực cho nhiều nhà phát triển và người dùng. Sự xuất hiện của DeepSeek R1 đã mang đến cho mọi người nhiều sự lựa chọn hơn.Từ mức chênh lệch giá gấp 30 lần giữa o1 và R1 đến mức giá cuối cùng của o3-mini gấp đôi giá của DeepSeek R1,

hiển thị tác động của DeepSeek R1 lên openai.Tuy nhiên, người dùng ChatGPT miễn phí chỉ có thể trải nghiệm o3-mini ở mức độ hạn chế, trong khi Deep Thinking của DeepSeek hiện đã có sẵn cho tất cả người dùng.Tôi cũng mong muốn openai mang đến nhiều mô hình ai hàng đầu hơn đồng thời giảm chi phí sử dụng cho người dùng.

Theo góc nhìn của một blogger trải nghiệm cá nhân khi sử dụng R1, tôi muốn nói rằng Deep Thinking của R1 luôn mở mang đầu óc của tôi. Tôi khuyên mọi người nên sử dụng nó nhiều hơn để suy nghĩ về các vấn đề~

Chưa phân loại

FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels

Quadeepseeker Tháng 2 24, 2025Tháng 2 24, 2025

FlashMLA đã nhanh chóng thu hút sự chú ý trong thế giới trí tuệ nhân tạo, đặc biệt là trong lĩnh vực mô hình ngôn ngữ lớn (LLM). Công cụ sáng tạo này, được phát triển bởi DeepSeek, đóng vai trò là hạt nhân giải mã được tối ưu hóa được thiết kế cho GPU Hopper—chip hiệu suất cao thường được sử dụng trong tính toán AI. FlashMLA tập trung vào việc xử lý hiệu quả các chuỗi có độ dài thay đổi, khiến nó đặc biệt phù hợp…

Chưa phân loại

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Chi phí cao khi sử dụng các mô hình AI lớn là lý do chính khiến nhiều ứng dụng AI vẫn chưa được triển khai và quảng bá. Việc lựa chọn hiệu suất cực cao có nghĩa là chi phí năng lượng tính toán rất lớn, dẫn đến chi phí sử dụng cao mà người dùng thông thường không thể chấp nhận. Cuộc cạnh tranh cho các mô hình AI lớn giống như một cuộc chiến không khói thuốc. Sau…

Chưa phân loại

DeepSeek TOP17 Lựa chọn thay thế tốt nhất: Phân tích toàn diện (2025)

Quadeepseeker Tháng 2 6, 2025Tháng 2 6, 2025

Giới thiệu Trong bối cảnh trí tuệ nhân tạo đang phát triển nhanh chóng, DeepSeek đã nổi lên như một mô hình ngôn ngữ mạnh mẽ. Phân tích toàn diện này khám phá 17 giải pháp thay thế hàng đầu cho DeepSeek, xem xét các tính năng, khả năng và trường hợp sử dụng độc đáo của chúng. Nghiên cứu của chúng tôi tập trung vào cả nền tảng quốc tế và Trung Quốc cung cấp tích hợp DeepSeek hoặc các khả năng tương tự. Phân tích các giải pháp thay thế hàng đầu 1….

Chưa phân loại

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Quazddeepseeker Tháng 2 8, 2025Tháng 2 8, 2025

Điểm nổi bật AI Agent định hình lại trải nghiệm của khách hàng Jesse Zhang: Một Agent thực sự được xây dựng như thế nào? Quan điểm của chúng tôi là theo thời gian, nó sẽ ngày càng giống với một Agent dựa trên ngôn ngữ tự nhiên vì đó là cách các mô hình ngôn ngữ lớn (LLM) được đào tạo. Về lâu dài, nếu bạn có một agent siêu thông minh…

Chưa phân loại

Công nghệ DeepSeek-R1 được tiết lộ: các nguyên tắc cốt lõi của bài báo được phân tích và chìa khóa để đạt được hiệu suất mô hình đột phá được tiết lộ

Quazddeepseeker Tháng 2 9, 2025Tháng 2 9, 2025

Hôm nay chúng tôi sẽ chia sẻ DeepSeek R1, Tiêu đề: DeepSeek-R1: Khuyến khích khả năng lý luận trong LLM thông qua Học tăng cường: Khuyến khích khả năng lý luận của LLM thông qua học tăng cường. Bài báo này giới thiệu thế hệ đầu tiên của các mô hình lý luận của DeepSeek, DeepSeek-R1-Zero và DeepSeek-R1. Mô hình DeepSeek-R1-Zero được đào tạo thông qua học tăng cường quy mô lớn (RL) mà không có điều chỉnh tinh chỉnh có giám sát (SFT) như một bước đầu tiên,…

Chưa phân loại

DeepSeek R1 đứng đầu trong bài kiểm tra viết sáng tạo, và o3 mini thậm chí còn tệ hơn o1 mini!

Quazddeepseeker Tháng 2 3, 2025Tháng 2 3, 2025

DeepSeek R1 đã giành chức vô địch trong bài kiểm tra chuẩn mực viết truyện ngắn sáng tạo, vượt qua thành công đối thủ thống trị trước đó là Claude 3.5 Sonnet! Bài kiểm tra chuẩn mực Bài kiểm tra chuẩn mực do nhà nghiên cứu Lech Mazur thiết kế không phải là cuộc thi viết thông thường của bạn. Mỗi mô hình AI được yêu cầu hoàn thành 500 truyện ngắn và mỗi câu chuyện phải khéo léo kết hợp…

So sánh toàn diện giữa o3-mini và DeepSeek R1 mới phát hành của OpenAI

Điểm nổi bật cốt lõi

So sánh

Giá

Bản tóm tắt

FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels

Mô hình giá rẻ của Google, dòng Gemini 2.0, đang tấn công: cuộc chiến giành hiệu quả về chi phí trong các mô hình lớn đang trở nên gay gắt hơn

DeepSeek TOP17 Lựa chọn thay thế tốt nhất: Phân tích toàn diện (2025)

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Công nghệ DeepSeek-R1 được tiết lộ: các nguyên tắc cốt lõi của bài báo được phân tích và chìa khóa để đạt được hiệu suất mô hình đột phá được tiết lộ

DeepSeek R1 đứng đầu trong bài kiểm tra viết sáng tạo, và o3 mini thậm chí còn tệ hơn o1 mini!

Để lại một bình luận Hủy

Điểm nổi bật cốt lõi

So sánh

Giá

Bản tóm tắt

Bài viết tương tự

Để lại một bình luận Hủy