Μια ολοκληρωμένη σύγκριση των πρόσφατα κυκλοφορηθέντων o3-mini και DeepSeek R1 του OpenAI

Το OpenAI κυκλοφόρησε το τελευταίο μοντέλο συμπερασμού του, o3-mini, το οποίο είναι βελτιστοποιημένο για τομείς όπως η επιστήμη, τα μαθηματικά και ο προγραμματισμός, παρέχοντας ταχύτερη απόκριση, μεγαλύτερη ακρίβεια και χαμηλότερο κόστος.

Σε σύγκριση με τον προκάτοχό του o1-mini, το o3-mini έχει βελτιώσει σημαντικά τις δυνατότητες εξαγωγής συμπερασμάτων, ιδίως στην επίλυση σύνθετων προβλημάτων. Οι δοκιμαστές προτιμούν τις απαντήσεις του o3-mini κατά 56% και το ποσοστό σφάλματος έχει μειωθεί κατά 39%. Από σήμερα, ChatGPT Plus, Ομάδα και Pro οι χρήστες μπορούν να χρησιμοποιήσουν το o3-mini, και ελεύθεροι χρήστες μπορούν επίσης να γνωρίσουν μερικά από τα χαρακτηριστικά του.

Σε σύγκριση με το μοντέλο εξαγωγής συμπερασμάτων DeepSeek-R1, πόσο καλύτερα είναι OpenAI o3-mini από το R1;

Αυτό το άρθρο θα δώσει πρώτα μια επισκόπηση των κυριότερων σημείων του o3-mini και στη συνέχεια θα εξάγουμε τα δεδομένα και από τις δύο πλευρές σε κάθε σημείο αναφοράς και θα δημιουργήσουμε ένα γράφημα για να τα συγκρίνουμε οπτικά. Επιπλέον, θα συγκρίνουμε και την τιμή του o3-mini.

Πίνακας περιεχομένων

Κύρια σημεία αναφοράς

1.Βελτιστοποίηση STEM: υπερέχει στους τομείς των μαθηματικών, του προγραμματισμού, της επιστήμης κ.λπ., ξεπερνώντας ιδιαίτερα το o1-mini στη λειτουργία υψηλής προσπάθειας εξαγωγής συμπερασμάτων.

2.Λειτουργίες προγραμματιστή: υποστηρίζει λειτουργίες όπως κλήσεις συναρτήσεων, δομημένη έξοδο και μηνύματα προγραμματιστών, ώστε να ανταποκρίνεται στις ανάγκες του περιβάλλοντος παραγωγής.

3.Γρήγορη ανταπόκριση: 24% ταχύτερα από το o1-mini, με χρόνο απόκρισης 7,7 δευτερόλεπτα ανά αίτηση.

4.Βελτίωση της ασφάλειας: εξασφαλίζει ασφαλή και αξιόπιστη έξοδο μέσω της τεχνολογίας βαθιάς ευθυγράμμισης.

5.Οικονομικά αποδοτικό: οι δυνατότητες εξαγωγής συμπερασμάτων και η βελτιστοποίηση του κόστους συμβαδίζουν, μειώνοντας σημαντικά το κατώφλι για τη χρήση της ΤΝ.

Σύγκριση

Open AI Προκειμένου να αναδείξει την κλάση του, το επίσημο blog το συγκρίνει μόνο με τα δικά του μοντέλα. Ως εκ τούτου, αυτό το άρθρο είναι ένας πίνακας που εξάγεται από το έγγραφο DeepSeek R1 και τα δεδομένα από το επίσημο ιστολόγιο του OpenAI.

Το OpenAI συγκρίνει επίσημα o3-mini στη λίστα εκδόσεων, χωρίζοντάς την σε τρεις εκδόσεις: χαμηλή, μεσαία και υψηλή, οι οποίες υποδεικνύουν την ισχύ των συμπερασμάτων. Δεδομένου ότι το DeepSeek χρησιμοποιεί το Math-500 και το OpenAI χρησιμοποιεί το σύνολο δεδομένων Math, αυτή η σύγκριση έχει αφαιρεθεί εδώ.

Ένα διάγραμμα είναι πιο διαισθητικό, και το Codeforces έχει αφαιρεθεί επειδή οι τιμές είναι πολύ μεγάλες για να εμφανίζονται διαισθητικά. Ωστόσο, η σύγκριση στο Codeforces δείχνει ότι η υψηλή ισχύς συμπερασμού του o3-mini δεν έχει μεγάλο προβάδισμα.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Από το διάγραμμα, υπάρχουν συνολικά 4 συγκρίσεις και το O3-mini (high) γενικά προηγείται, αλλά το προβάδισμα είναι πολύ μικρό.

Τιμή

μοντέλο	Τιμή εισροών	Χτύπημα μνήμης cache	Τιμή παραγωγής
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Περίληψη

Με το DeepSeek R1 να πυροδοτεί τον πανικό του DeepSeek στις Ηνωμένες Πολιτείες, ο πρώτος που ένιωσε να απειλείται ήταν η OpenAI, κάτι που είναι ιδιαίτερα εμφανές στην τιμολόγηση του νέου της μοντέλου o3-mini.

Όταν κυκλοφόρησε για πρώτη φορά το Openai o1, η υψηλή τιμή του άσκησε πίεση σε πολλούς προγραμματιστές και χρήστες. Η εμφάνιση του DeepSeek R1 έδωσε σε όλους περισσότερες επιλογές.Από την 30πλάσια διαφορά τιμής μεταξύ των o1 και R1 έως την τελική τιμή του o3-mini που είναι διπλάσια την τιμή του DeepSeek R1,

δείχνει τον αντίκτυπο του DeepSeek R1 στο openai.Ωστόσο, οι δωρεάν χρήστες του ChatGPT μπορούν να βιώσουν το o3-mini μόνο με περιορισμένο τρόπο, ενώ το Deep Thinking του DeepSeek είναι προς το παρόν διαθέσιμο σε όλους τους χρήστες.Ανυπομονώ επίσης να φέρει το openai περισσότερα κορυφαία μοντέλα ai, μειώνοντας παράλληλα το κόστος χρήσης για τους χρήστες.

Από τη σκοπιά της προσωπικής εμπειρίας ενός blogger που χρησιμοποιεί το R1, θα ήθελα να πω ότι το Deep Thinking του R1 ανοίγει πάντα το μυαλό μου. Συνιστώ σε όλους να το χρησιμοποιούν περισσότερο για να σκέφτονται τα προβλήματα~

Uncategorized

Είναι κοντά στο DeepSeek-R1-32B και συνθλίβει το s1 του Fei-Fei Li! UC Berkeley και άλλα ανοιχτού κώδικα νέα μοντέλα συμπερασμάτων SOTA

Μεzddeepseeker Φεβρουάριος 14, 2025Φεβρουάριος 14, 2025

Το μοντέλο συμπερασμάτων 32B χρησιμοποιεί μόνο το 1/8 των δεδομένων και συνδέεται με DeepSeek-R1 ίδιου μεγέθους! Μόλις τώρα, ιδρύματα όπως το Stanford, το UC Berkeley και το Πανεπιστήμιο της Ουάσιγκτον κυκλοφόρησαν από κοινού ένα μοντέλο συμπερασμάτων σε επίπεδο SOTA, το OpenThinker-32B, και έχουν επίσης δεδομένα εκπαίδευσης ανοιχτού κώδικα έως και 114k. Αρχική σελίδα OpenThinker Project: OpenThinker Hugging Face:…

Uncategorized

Τα κύρια προϊόντα τεχνητής νοημοσύνης στον κόσμο επικεντρώνονται στην ανάλυση και τις ολοκληρωμένες οδηγίες εμπειρίας χρήστη (συμπεριλαμβανομένων των DeepSeek και GPT)

Μεzddeepseeker Φεβρουάριος 10, 2025Φεβρουάριος 10, 2025

Τοποθέτηση λειτουργιών και ανάλυση βασικών πλεονεκτημάτων ChatGPT (OpenAI) – το παγκόσμιο σημείο αναφοράς για τεχνικά γονίδια ChatGPT: γενετική τεχνητή νοημοσύνη που βασίζεται στη σειρά μεγάλων μοντέλων GPT, με βασικά πλεονεκτήματα τις γενικές δεξιότητες συνομιλίας και τη λογική συλλογιστική. Πολυγλωσσική επεξεργασία: αποδίδει καλύτερα στα Αγγλικά, με συνεχή βελτίωση στα Κινεζικά, αλλά συνιστούμε να χρησιμοποιείτε τα Αγγλικά για να…

Uncategorized

Η Google κυκλοφόρησε τρία νέα μοντέλα ταυτόχρονα: το Gemini-2.0-Pro είναι δωρεάν, έχει εξαιρετική βαθμολογία και κατατάσσεται στην πρώτη θέση και είναι κατάλληλο για κωδικοποίηση και επεξεργασία σύνθετων μηνυμάτων!

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Η ιστορία του Gemini 2.0 επιταχύνεται. Η έκδοση Flash Thinking Experimental τον Δεκέμβριο έφερε στους προγραμματιστές ένα λειτουργικό μοντέλο με χαμηλό λανθάνοντα χρόνο και υψηλή απόδοση. Νωρίτερα φέτος, το 2.0 Flash Thinking Experimental ενημερώθηκε στο Google AI Studio για να βελτιώσει περαιτέρω την απόδοση συνδυάζοντας την ταχύτητα του Flash με βελτιωμένες δυνατότητες συμπερασμάτων. Την περασμένη εβδομάδα,…

Uncategorized

Τι είναι το FlashMLA; Ένας ολοκληρωμένος οδηγός για τον αντίκτυπό του στους πυρήνες αποκωδικοποίησης AI

Μεdeepseeker Φεβρουάριος 24, 2025Φεβρουάριος 24, 2025

Το FlashMLA έχει κερδίσει γρήγορα την προσοχή στον κόσμο της τεχνητής νοημοσύνης, ιδιαίτερα στον τομέα των μεγάλων γλωσσικών μοντέλων (LLMs). Αυτό το καινοτόμο εργαλείο, που αναπτύχθηκε από την DeepSeek, χρησιμεύει ως ένας βελτιστοποιημένος πυρήνας αποκωδικοποίησης που έχει σχεδιαστεί για GPUs Hopper—τσιπ υψηλής απόδοσης που χρησιμοποιούνται συνήθως σε υπολογισμούς τεχνητής νοημοσύνης. Το FlashMLA εστιάζει στην αποτελεσματική επεξεργασία ακολουθιών μεταβλητού μήκους, καθιστώντας το ιδιαίτερα κατάλληλο…

Uncategorized

Qwen2.5-max vs DeepSeek R1: Μια βαθιά σύγκριση μοντέλων: πλήρης ανάλυση σεναρίων εφαρμογών

Μεzddeepseeker Φεβρουάριος 14, 2025Φεβρουάριος 14, 2025

Εισαγωγή Σήμερα, τα μεγάλα γλωσσικά μοντέλα (LLM) διαδραματίζουν κρίσιμο ρόλο. Στις αρχές του 2025, καθώς ο ανταγωνισμός για την τεχνητή νοημοσύνη εντάθηκε, η Alibaba παρουσίασε το νέο μοντέλο AI Qwen2.5-max και η DeepSeek, μια εταιρεία από το Hangzhou της Κίνας, κυκλοφόρησε το μοντέλο R1, το οποίο αντιπροσωπεύει την κορυφή της τεχνολογίας LLM. Το Deepseek R1 είναι ένα μοντέλο ανοιχτού κώδικα AI που έχει προσελκύσει…

Uncategorized

Στον κύκλο της τεχνητής νοημοσύνης, το DeepSeek R1 ξεπέρασε σταθερά τους o1 και Claude στις φυσικές δοκιμές και έχουμε εισέλθει στη χρυσή εποχή του RL.

Μεzddeepseeker Φεβρουάριος 1, 2025Φεβρουάριος 1, 2025

Κανείς μας δεν περίμενε ότι έτσι θα ξεκινούσε το 2025 στον τομέα της τεχνητής νοημοσύνης. Το DeepSeek R1 είναι πραγματικά εκπληκτικό! Πρόσφατα, η "μυστηριώδης ανατολική δύναμη" DeepSeek "ελέγχει σκληρά" τη Silicon Valley. Ζήτησα από τον R1 να εξηγήσει λεπτομερώς το Πυθαγόρειο θεώρημα. Όλα αυτά έγιναν από την AI σε λιγότερο από 30 δευτερόλεπτα χωρίς καμία...

Μια ολοκληρωμένη σύγκριση των πρόσφατα κυκλοφορηθέντων o3-mini και DeepSeek R1 της OpenAI

Κύρια σημεία αναφοράς

Σύγκριση

Τιμή

Περίληψη

Είναι κοντά στο DeepSeek-R1-32B και συνθλίβει το s1 του Fei-Fei Li! UC Berkeley και άλλα ανοιχτού κώδικα νέα μοντέλα συμπερασμάτων SOTA

Τι είναι το FlashMLA; Ένας ολοκληρωμένος οδηγός για τον αντίκτυπό του στους πυρήνες αποκωδικοποίησης AI

Qwen2.5-max vs DeepSeek R1: Μια βαθιά σύγκριση μοντέλων: πλήρης ανάλυση σεναρίων εφαρμογών

Στον κύκλο της τεχνητής νοημοσύνης, το DeepSeek R1 ξεπέρασε σταθερά τους o1 και Claude στις φυσικές δοκιμές και έχουμε εισέλθει στη χρυσή εποχή του RL.

Αφήστε μια απάντηση Ακύρωση απάντησης

Κύρια σημεία αναφοράς

Σύγκριση

Τιμή

Περίληψη

Παρόμοιες θέσεις

Αφήστε μια απάντηση Ακύρωση απάντησης