o3-mini và o3-mini (cao) sẽ được phát hành vào hôm nay.

Người dùng thường xuyên cũng sẽ nhận được o3-minivà người dùng cũng có thể sử dụng o3-mini (cao).

o3-mini (cao) cao hơn o1 khoảng 200 điểm trên Codeforce, nhanh hơn o1 và hoạt động tốt hơn trong mã hóa và toán học, nhưng chi phí vẫn ở mức của o1-mini.

Người dùng Plus có thể sử dụng o3-mini 100 lần một ngày. Tuy nhiên, giới hạn sử dụng của o3-mini (cao) cần được xác nhận thêm.

Một số cư dân mạng cho biết, đúng vậy, R1 quá nổi tiếng đến nỗi Openai không thể kìm lòng được:

Và trước đó, đội ngũ Alibaba Qwen đã phát hành qwen2.5-max vào đêm giao thừa. Trong suốt lễ hội mùa xuân, mọi người vẫn cần phải lăn, hahaha…

Trên thực tế, ngay từ chương trình phát sóng trực tiếp Giáng sinh, Openai thông báo rằng o3 mini sẽ có mặt vào đầu năm 2025:

Chúng ta vẫn cần phải nói về o3 và o3-mini là gì?

o3: Một mô hình suy luận tiên tiến vượt trội trong mã hóa, toán học và thậm chí là các bài kiểm tra chuẩn định hướng AGI. Nó đặt ra chuẩn mực mới cho trí thông minh và giải quyết vấn đề.

o3-mini: Phiên bản o3 tiết kiệm chi phí, cung cấp hiệu suất vượt trội với chi phí và tốc độ rất thấp.

Những mô hình này đã đưa suy luận lên một tầm cao mới, tạo ra bước đột phá trong các nhiệm vụ phức tạp đòi hỏi sự hiểu biết sâu sắc và logic.

o3 mang lại ba bước đột phá lớn.

Khả năng lập trình: Độ chính xác 71,7% trong lập trình thực tế, cao hơn 20% so với o1. 2727 điểm trên Codeforces, đã vượt qua trình độ của con người.

Trình độ toán học: gần đạt độ chính xác 97% trong vòng loại Olympic Toán học Hoa Kỳ. Ngay cả những bài toán khó nhất của Epic AI Frontier cũng có thể đạt kết quả 25%.

Điều tuyệt vời nhất chính là bài kiểm tra Arc AGI: 87.5%, lần đầu tiên vượt qua con người trong bài kiểm tra chuẩn cực kỳ khó khăn này.

Tại sao o3-mini lại là một cải tiến mang tính đột phá? O3-mini mang đến hai thay đổi.

Tư duy thích ứng: độ sâu của lý luận có thể được điều chỉnh theo độ khó của nhiệm vụ, với ba chế độ để lựa chọn: thấp, trung bình và cao.

Điều này giúp AI phù hợp hơn với các tình huống sử dụng trong thế giới thực.

Đột phá về hiệu quả chi phí: chi phí thấp hơn o1-mini, phản ứng nhanh hơn và kết quả tốt hơn.

Tuy nhiên, cư dân mạng than phiền rằng o3 high tiêu tốn $1.000 cho mỗi tác vụ:

Ngoài ra, thực sự có quá nhiều mẫu mã và chúng tôi vẫn chưa xác nhận cách chuyển đổi giữa chúng.

Bài viết tương tự

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *