DeepSeek-R1-0528 Ενημέρωση: Βαθύτερη Σκέψη, Ισχυρότερη Συλλογιστική

Το Μοντέλο DeepSeek R1 έχει υποστεί μια μικρή αναβάθμιση έκδοσης, με την τρέχουσα έκδοση να είναι DeepSeek-R1-0528. Όταν εισέρχεστε στην ιστοσελίδα ή την εφαρμογή DeepSeek, ενεργοποιήστε τη λειτουργία "Deep Thinking" στη διεπαφή διαλόγου για να απολαύσετε την πιο πρόσφατη έκδοση.

Τα βάρη του μοντέλου DeepSeek-R1-0528 έχουν ανέβει στο HuggingFace

Τους τελευταίους τέσσερις μήνες, το DeepSeek-R1 έχει υποστεί υπερεξέλιξη, επιτυγχάνοντας δυνατότητες κωδικοποίησης που είναι ασυναγώνιστες και σημαντικά μεγαλύτερους χρόνους σκέψης. Παρόλο που μπορεί να μην είναι το DeepSeek-R2 Όπως όλοι περίμεναν, οι βελτιώσεις στο μοντέλο DeepSeek-R1-0528 είναι σημαντικές.

Σύμφωνα με αναφορές, το νέο μοντέλο εκπαιδεύεται στο DeepSeek-V3-0324 (με παραμέτρους 660B).

Ας ρίξουμε πρώτα μια γρήγορη ματιά στις βασικές ενημερώσεις αυτής της έκδοσης μέσω ενός πίνακα

Διάσταση Δυνατότητας	deepseek-R1	Deepseek-R1-0528
Μέγιστο Πλαίσιο	64k (API)	128K (API) ακόμη περισσότερα
Δημιουργία κώδικα	liveCodeBench κλείσιμο ανοίγματος O1	Κοντά στο O3
Βάθος συλλογισμού	Οι σύνθετες ερωτήσεις απαιτούν τμηματοποιημένες υποδείξεις.	Υποστηρίζει 30-60 λεπτά βαθιάς σκέψης
Φυσικότητα της γλώσσας	μάλλον μακροσκελής	Συμπαγής δομή, γραφή παρόμοια με το O3
Κόστος Χρήσης	Ανοιχτού κώδικα ή API$0.5/M	Ανοιχτού κώδικα ή API$0.5/M

Πίνακας περιεχομένων

Βελτιωμένες ικανότητες βαθιάς σκέψης

Το DeepSeek-R1-0528 εξακολουθεί να χρησιμοποιεί το βασικό μοντέλο DeepSeek V3 που κυκλοφόρησε τον Δεκέμβριο του 2024 ως βάση του, αλλά κατά τη διάρκεια της μετεκπαίδευσης, επενδύθηκε περισσότερη υπολογιστική ισχύς, ενισχύοντας σημαντικά το βάθος σκέψης και τις δυνατότητες συλλογισμού του μοντέλου.

Το ανανεωμένο μοντέλο R1 έχει επιτύχει κορυφαία απόδοση μεταξύ όλων των εγχώριων μοντέλων σε πολλαπλές αξιολογήσεις benchmark, συμπεριλαμβανομένων των μαθηματικών, του προγραμματισμού και της γενικής λογικής, και η συνολική του απόδοση είναι πλέον εφάμιλλη με άλλα διεθνή κορυφαία μοντέλα όπως το o3 και το Gemini-2.5-Pro.

Δυνατότητες μαθηματικών και προγραμματισμού: Στον διαγωνισμό μαθηματικών AIME 2025, η ακρίβεια βελτιώθηκε από 70% στην προηγούμενη έκδοση σε 87,5%. Οι δυνατότητες δημιουργίας κώδικα στο benchmark test LiveCodeBench είναι σχεδόν στο ίδιο επίπεδο με το μοντέλο o3-high του OpenAI, με την επίτευξη βαθμολογίας pass@1 να είναι 73,3%.

Οι δοκιμές χρηστών δείχνουν ότι το νέο DeepSeek-R1 είναι απλά εκπληκτικό στον προγραμματισμό!

Ο ειδικός στην τεχνητή νοημοσύνη «karminski-dentist» εξέτασε το DeepSeek-R1-0528 και το Claude 4 Sonnet χρησιμοποιώντας την ίδια προτροπή και διαπίστωσε ότι:

Είτε πρόκειται για τη διάχυτη αντανάκλαση του φωτός σε έναν τοίχο, την κατεύθυνση κίνησης μιας μπάλας μετά την πρόσκρουση, είτε την αισθητική ενός πίνακα ελέγχου, το R1 ξεπερνά σαφώς τον ανταγωνισμό.

Ο χρήστης Haider έβαλε το μοντέλο να κατασκευάσει ένα σύστημα βαθμολόγησης λέξεων. Ο R1 εξέτασε για λίγο την εργασία και αμέσως δημιούργησε δύο αρχεία—ένα για κώδικα και ένα άλλο για δοκιμή εργασίας—τα οποία έτρεξαν άψογα με την πρώτη προσπάθεια.

Προηγουμένως, το o3 ήταν το μόνο μοντέλο ικανό να ολοκληρώσει αυτό το έργο. Τώρα, το R1 είναι αναμφίβολα το καλύτερο μοντέλο για αυτό το έργο.

Σημειώστε ότι η απόδοση του R1 είναι τόσο αξιοσημείωτη επειδή τα δύο αρχεία που επιστρέφει εκτελούνται άψογα με την πρώτη προσπάθεια, χωρίς καμία επεξεργασία ή επανάληψη, κάτι που είναι εξαιρετικά σπάνιο.

Προηγουμένως, τα περισσότερα μοντέλα είτε κατέληγαν σε ακραίες περιπτώσεις, είτε περιέπλεκαν υπερβολικά τη λύση είτε δεν είχαν επαρκή κάλυψη δοκιμών.

Βάθος συμπερασμάτων: Ο χρόνος σκέψης για μία μόνο εργασία επεκτάθηκε σε 30-60 λεπτά, με σημαντικά βελτιωμένες δυνατότητες επίλυσης προβλημάτων για σύνθετα ζητήματα (π.χ., προσομοιώσεις φυσικής, λογικά παζλ πολλαπλών βημάτων).

Ο μεγαλύτερος χρόνος σκέψης έχει γίνει το πιο πολυσυζητημένο χαρακτηριστικό στο διαδίκτυο. Ορισμένοι χρήστες ανέφεραν ότι ο χρόνος σκέψης του R1 ξεπέρασε τα 25 λεπτά σε δοκιμές σε πραγματικό κόσμο.

Επιπλέον, αυτό φαίνεται να είναι το μόνο μοντέλο που είναι ικανό να απαντήσει σωστά στην ερώτηση «Πόσο κάνει 9,9 μείον 9,11;»

Το DeepSeek-R1-0528 πέτυχε εξαιρετική απόδοση σε όλα τα σύνολα δεδομένων αξιολόγησης

Σε σύγκριση με την προηγούμενη έκδοση του R1, το νέο μοντέλο παρουσιάζει σημαντικές βελτιώσεις σε σύνθετες εργασίες συλλογισμού. Για παράδειγμα, στη δοκιμή AIME 2025, το ποσοστό ακρίβειας του νέου μοντέλου αυξήθηκε από 70% σε 87,5%.

Αυτή η βελτίωση οφείλεται στο βελτιωμένο βάθος συλλογισμού στο μοντέλο: στο σύνολο δοκιμών AIME 2025, το παλιό μοντέλο χρησιμοποιούσε κατά μέσο όρο 12.000 διακριτικά ανά ερώτηση, ενώ το νέο μοντέλο χρησιμοποιούσε κατά μέσο όρο 23.000 διακριτικά ανά ερώτηση, υποδεικνύοντας πιο λεπτομερή και εις βάθος σκέψη στη διαδικασία επίλυσης προβλημάτων.

Επιπλέον, η ομάδα deepseek ανέλυσε την αλυσίδα συλλογισμού από το DeepSeek-R1-0528 και βελτίωσε τη βάση Qwen3-8B, με αποτέλεσμα το DeepSeek-R1-0528-Qwen3-8B.

Αυτό το μοντέλο 8B κατατάχθηκε δεύτερο μόνο μετά το DeepSeek-R1-0528 στο τεστ μαθηματικών AIME 2024, ξεπερνώντας σε απόδοση το Qwen3-8B (+10,0%) και ισοφαρίζοντας το Qwen3-235B.

Οι αλυσίδες συλλογισμού του DeepSeek-R1-0528 θα έχουν σημαντικές επιπτώσεις στην ακαδημαϊκή έρευνα σχετικά με τα μοντέλα συλλογισμού και τη βιομηχανική ανάπτυξη μοντέλων μικρής κλίμακας.

Μερικοί χρήστες του διαδικτύου επαίνεσαν το DeepSeek-R1 για την ικανότητά του να διορθώνει αλυσίδες συλλογισμού όπως το o3 και να κατασκευάζει δημιουργικά κόσμους όπως ο Claude.

Είναι σημαντικό να σημειωθεί ότι το DeepSeek είναι ένα μοντέλο ανοιχτού κώδικα, σηματοδοτώντας μια σημαντική νίκη για τα μοντέλα ανοιχτού κώδικα.

Αποτελέσματα σύγκρισης AIME 2024 για μοντέλα ανοιχτού κώδικα όπως το DeepSeek-R1-0528-Qwen3-8B

Άλλες ενημερώσεις δυνατοτήτων

Βελτίωση παραισθήσεων: Η νέα έκδοση του DeepSeek R1 έχει βελτιστοποιήσει την απόδοση για προβλήματα «παραισθήσεων». Σε σύγκριση με την προηγούμενη έκδοση, το ενημερωμένο μοντέλο επιτυγχάνει μείωση 45–50% στα ποσοστά παραισθήσεων σε εργασίες όπως η επανεγγραφή και η λείανση, η σύνοψη και η κατανόηση κειμένου, παρέχοντας πιο ακριβή και αξιόπιστα αποτελέσματα.
Δημιουργική Γραφή: Με βάση την προηγούμενη έκδοση R1, το ενημερωμένο μοντέλο R1 έχει βελτιστοποιηθεί περαιτέρω για στυλ γραφής δοκιμίων, μυθιστορημάτων και πεζογραφίας, επιτρέποντάς του να δημιουργεί μεγαλύτερα, πιο δομικά ολοκληρωμένα έργα, παρουσιάζοντας παράλληλα ένα στυλ γραφής που είναι περισσότερο ευθυγραμμισμένο με τις ανθρώπινες προτιμήσεις.
Επίκληση εργαλείου: Το DeepSeek-R1-0528 υποστηρίζει την επίκληση εργαλείου (η επίκληση εργαλείου δεν υποστηρίζεται στη σκέψη). Οι βαθμολογίες αξιολόγησης Tau-Bench του τρέχοντος μοντέλου είναι 53,5% για την αεροπορική εταιρεία και 63,9% για το λιανικό εμπόριο, συγκρίσιμες με το OpenAI o1-high, αλλά εξακολουθούν να υστερούν σε σχέση με το o3-High και το Claude 4 Sonnet.

Το παράδειγμα δείχνει μια σύνοψη διαδικτυακού άρθρου που δημιουργήθηκε χρησιμοποιώντας τη δυνατότητα κλήσης εργαλείου του DeepSeek-R1-0528 μέσω του LobeChat. Επιπλέον, το DeepSeek-R1-0528 έχει ενημερωθεί και βελτιωθεί σε τομείς όπως η δημιουργία κώδικα front-end και το παιχνίδι ρόλων.

Το παράδειγμα δείχνει μια σύγχρονη και μινιμαλιστική εφαρμογή κάρτας λέξεων που αναπτύχθηκε χρησιμοποιώντας HTML/CSS/JavaScript καλώντας το DeepSeek-R1-0528 σε μια ιστοσελίδα.

Βασικά σημεία της ενημέρωσης DeepSeek-R1-0528

Δυνατότητες βαθιάς συλλογιστικής συγκρίσιμες με τα μοντέλα της Google
Βελτιστοποίηση δημιουργίας κειμένου: πιο φυσικό και με καλύτερη μορφοποίηση
Μοναδικό στυλ συλλογισμού: όχι μόνο πιο γρήγορο αλλά και πιο αυστηρό
Υποστήριξη μακροπρόθεσμης σκέψης: ο χρόνος επεξεργασίας μίας μόνο εργασίας μπορεί να φτάσει τα 30-60 λεπτά

Οι δυνατότητες της νέας έκδοσης του DeepSeek-R1 έχουν δοκιμαστεί από εμάς. Παρόλο που πρόκειται για μια ενημέρωση «δευτερεύουσας έκδοσης», η απόδοσή της έχει βελτιωθεί «επικά».

Ειδικά όσον αφορά τις δυνατότητες προγραμματισμού, δίνει την αίσθηση ότι έχει ξεπεράσει ή είναι στο ίδιο επίπεδο με τα Claude 4 και Gemini 2.5 Pro. Όλες οι οδηγίες είναι «μονόδρομες», χωρίς να απαιτούνται τροποποιήσεις! Και μπορεί να εκτελεστεί απευθείας σε ένα πρόγραμμα περιήγησης ιστού για να επιδειχθούν οι δυνατότητές του.

Μπορείτε να νιώσετε ξεκάθαρα ότι η διαδικασία σκέψης της νέας έκδοσης DeepSeek-R1 είναι πιο σταθερή.

Μπορείτε να κάνετε στον deepseek-R1 οποιαδήποτε ερώτηση θέλετε να μάθετε την απάντηση, ακόμα κι αν η ερώτησή σας είναι λίγο ανόητη, θα σκεφτεί προσεκτικά και θα οργανώσει τη λογική. Σας συνιστούμε ανεπιφύλακτα να δοκιμάσετε το πιο πρόσφατο μοντέλο deepseek-R1.

Πληροφορίες ενημέρωσης API

Το API έχει ενημερωθεί, αλλά η διεπαφή και οι μέθοδοι κλήσης παραμένουν αμετάβλητες. Το νέο R1 API εξακολουθεί να υποστηρίζει την προβολή της διαδικασίας σκέψης του μοντέλου και τώρα υποστηρίζει επίσης την Κλήση Συναρτήσεων και το JsonOutput.

Η ομάδα deepseek έχει προσαρμόσει την έννοια της παραμέτρου max_tokens στο νέο R1 API: το max_tokens περιορίζει πλέον το συνολικό μήκος της μοναδικής εξόδου του μοντέλου (συμπεριλαμβανομένης της διαδικασίας σκέψης), με προεπιλεγμένη τιμή 32K και μέγιστο 64K. Συνιστάται στους χρήστες API να προσαρμόσουν την παράμετρο max_tokens άμεσα για να αποτρέψουν την πρόωρη περικοπή της εξόδου.

Για λεπτομερείς οδηγίες σχετικά με τη χρήση του μοντέλου R1, ανατρέξτε στο Οδηγός API deepseek R1:

Μετά από αυτήν την ενημέρωση R1, το μήκος περιβάλλοντος του μοντέλου στον επίσημο ιστότοπο, το μίνι πρόγραμμα, την εφαρμογή και το API θα παραμείνει 64K. Εάν οι χρήστες χρειάζονται μεγαλύτερο μήκος περιβάλλοντος, μπορούν να καλέσουν την έκδοση ανοιχτού κώδικα του μοντέλου R1-0528 με μήκος περιβάλλοντος 128K μέσω άλλων πλατφορμών τρίτων.

Ανοιχτός κώδικας

Το DeepSeek-R1-0528 χρησιμοποιεί το ίδιο βασικό μοντέλο με το προηγούμενο DeepSeek-R1, με μόνο βελτιώσεις στις μεθόδους μετά την εκπαίδευση.

Κατά την ιδιωτική ανάπτυξη, χρειάζεται να ενημερωθούν μόνο το σημείο ελέγχου και το tokenizer_config.json (αλλαγές που σχετίζονται με τις κλήσεις εργαλείων). Οι παράμετροι του μοντέλου είναι 685B (εκ των οποίων τα 14B είναι για το επίπεδο MTP) και η έκδοση ανοιχτού κώδικα έχει μήκος περιβάλλοντος 128K (παρέχεται μήκος περιβάλλοντος 64K για ιστό, εφαρμογή και API).

Ενημέρωση DeepSeek-R1-0528: Βαθύτερη σκέψη, ισχυρότερη συλλογιστική

Βελτιωμένες ικανότητες βαθιάς σκέψης

Άλλες ενημερώσεις δυνατοτήτων

Πληροφορίες ενημέρωσης API

Ανοιχτός κώδικας

OpenAI o3-mini vs. DeepSeek-R1: Ποιος είναι ο βασιλιάς της νέας γενιάς μοντέλων τεχνητής νοημοσύνης;

Qwen2.5-max vs DeepSeek R1: Μια βαθιά σύγκριση μοντέλων: πλήρης ανάλυση σεναρίων εφαρμογών

Altman: Κάναμε λάθος για την τεχνητή νοημοσύνη ανοιχτού κώδικα! Το DeepSeek έκανε το OpenAI λιγότερο πλεονεκτικό, και το επόμενο είναι το GPT-5

Αντικείμενα διαχείρισης μοντέλων μεγάλων γλωσσών όπως DeepSeek: Cherry Studio, Chatbox, AnythingLLM, ποιος είναι ο επιταχυντής απόδοσης;

Paper-DeepSeek-R1: Κίνητρα για την ικανότητα συλλογισμού σε LLMs μέσω ενισχυτικής μάθησης

Έκτακτη είδηση! Το OpenAI κυκλοφόρησε σήμερα 2 νέα μοντέλα συμπερασμού: o3-mini και o3-mini-high.

Αφήστε μια απάντηση Ακύρωση απάντησης

Βελτιωμένες ικανότητες βαθιάς σκέψης

Άλλες ενημερώσεις δυνατοτήτων

Πληροφορίες ενημέρωσης API

Ανοιχτός κώδικας

Παρόμοιες θέσεις

Αφήστε μια απάντηση Ακύρωση απάντησης