Το OpenAI κυκλοφόρησε το τελευταίο μοντέλο συμπερασμού του, o3-mini, το οποίο είναι βελτιστοποιημένο για τομείς όπως η επιστήμη, τα μαθηματικά και ο προγραμματισμός, παρέχοντας ταχύτερη απόκριση, μεγαλύτερη ακρίβεια και χαμηλότερο κόστος.
Σε σύγκριση με τον προκάτοχό του o1-mini, το o3-mini έχει βελτιώσει σημαντικά τις δυνατότητες εξαγωγής συμπερασμάτων, ιδίως στην επίλυση σύνθετων προβλημάτων. Οι δοκιμαστές προτιμούν τις απαντήσεις του o3-mini κατά 56% και το ποσοστό σφάλματος έχει μειωθεί κατά 39%. Από σήμερα, ChatGPT Plus, Ομάδα και Pro οι χρήστες μπορούν να χρησιμοποιήσουν το o3-mini, και ελεύθεροι χρήστες μπορούν επίσης να γνωρίσουν μερικά από τα χαρακτηριστικά του.

Σε σύγκριση με το μοντέλο εξαγωγής συμπερασμάτων DeepSeek-R1, πόσο καλύτερα είναι OpenAI o3-mini από το R1;
Αυτό το άρθρο θα δώσει πρώτα μια επισκόπηση των κυριότερων σημείων του o3-mini και στη συνέχεια θα εξάγουμε τα δεδομένα και από τις δύο πλευρές σε κάθε σημείο αναφοράς και θα δημιουργήσουμε ένα γράφημα για να τα συγκρίνουμε οπτικά. Επιπλέον, θα συγκρίνουμε και την τιμή του o3-mini.
Κύρια σημεία αναφοράς
1.Βελτιστοποίηση STEM: υπερέχει στους τομείς των μαθηματικών, του προγραμματισμού, της επιστήμης κ.λπ., ξεπερνώντας ιδιαίτερα το o1-mini στη λειτουργία υψηλής προσπάθειας εξαγωγής συμπερασμάτων.
2.Λειτουργίες προγραμματιστή: υποστηρίζει λειτουργίες όπως κλήσεις συναρτήσεων, δομημένη έξοδο και μηνύματα προγραμματιστών, ώστε να ανταποκρίνεται στις ανάγκες του περιβάλλοντος παραγωγής.
3.Γρήγορη ανταπόκριση: 24% ταχύτερα από το o1-mini, με χρόνο απόκρισης 7,7 δευτερόλεπτα ανά αίτηση.
4.Βελτίωση της ασφάλειας: εξασφαλίζει ασφαλή και αξιόπιστη έξοδο μέσω της τεχνολογίας βαθιάς ευθυγράμμισης.
5.Οικονομικά αποδοτικό: οι δυνατότητες εξαγωγής συμπερασμάτων και η βελτιστοποίηση του κόστους συμβαδίζουν, μειώνοντας σημαντικά το κατώφλι για τη χρήση της ΤΝ.
Σύγκριση
Open AI Προκειμένου να αναδείξει την κλάση του, το επίσημο blog το συγκρίνει μόνο με τα δικά του μοντέλα. Ως εκ τούτου, αυτό το άρθρο είναι ένας πίνακας που εξάγεται από το έγγραφο DeepSeek R1 και τα δεδομένα από το επίσημο ιστολόγιο του OpenAI.
Το OpenAI συγκρίνει επίσημα o3-mini στη λίστα εκδόσεων, χωρίζοντάς την σε τρεις εκδόσεις: χαμηλή, μεσαία και υψηλή, οι οποίες υποδεικνύουν την ισχύ των συμπερασμάτων. Δεδομένου ότι το DeepSeek χρησιμοποιεί το Math-500 και το OpenAI χρησιμοποιεί το σύνολο δεδομένων Math, αυτή η σύγκριση έχει αφαιρεθεί εδώ.

Ένα διάγραμμα είναι πιο διαισθητικό, και το Codeforces έχει αφαιρεθεί επειδή οι τιμές είναι πολύ μεγάλες για να εμφανίζονται διαισθητικά. Ωστόσο, η σύγκριση στο Codeforces δείχνει ότι η υψηλή ισχύς συμπερασμού του o3-mini δεν έχει μεγάλο προβάδισμα.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified
Από το διάγραμμα, υπάρχουν συνολικά 4 συγκρίσεις και το O3-mini (high) γενικά προηγείται, αλλά το προβάδισμα είναι πολύ μικρό.
Τιμή
μοντέλο | Τιμή εισροών | Χτύπημα μνήμης cache | Τιμή παραγωγής |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
Deepseek R1 | $0.55 | $0.14 | $2.19 |
Περίληψη
Με το DeepSeek R1 να πυροδοτεί τον πανικό του DeepSeek στις Ηνωμένες Πολιτείες, ο πρώτος που ένιωσε να απειλείται ήταν η OpenAI, κάτι που είναι ιδιαίτερα εμφανές στην τιμολόγηση του νέου της μοντέλου o3-mini.
Όταν κυκλοφόρησε για πρώτη φορά το Openai o1, η υψηλή τιμή του άσκησε πίεση σε πολλούς προγραμματιστές και χρήστες. Η εμφάνιση του DeepSeek R1 έδωσε σε όλους περισσότερες επιλογές.Από την 30πλάσια διαφορά τιμής μεταξύ των o1 και R1 έως την τελική τιμή του o3-mini που είναι διπλάσια την τιμή του DeepSeek R1,
δείχνει τον αντίκτυπο του DeepSeek R1 στο openai.Ωστόσο, οι δωρεάν χρήστες του ChatGPT μπορούν να βιώσουν το o3-mini μόνο με περιορισμένο τρόπο, ενώ το Deep Thinking του DeepSeek είναι προς το παρόν διαθέσιμο σε όλους τους χρήστες.Ανυπομονώ επίσης να φέρει το openai περισσότερα κορυφαία μοντέλα ai, μειώνοντας παράλληλα το κόστος χρήσης για τους χρήστες.
Από τη σκοπιά της προσωπικής εμπειρίας ενός blogger που χρησιμοποιεί το R1, θα ήθελα να πω ότι το Deep Thinking του R1 ανοίγει πάντα το μυαλό μου. Συνιστώ σε όλους να το χρησιμοποιούν περισσότερο για να σκέφτονται τα προβλήματα~