Πώς δημιουργήθηκε το DeepSeek; Ανάλυση του ιστορικού ανάπτυξης του DeepSeek

Πώς δημιουργήθηκε το DeepSeek; Ανάλυση του ιστορικού ανάπτυξης του DeepSeek

Στο μέλλον, η καινοτομία θα γίνεται όλο και πιο σκληροπυρηνική. Μπορεί να μην είναι εύκολο να το καταλάβουμε τώρα, επειδή ολόκληρη η κοινωνική ομάδα πρέπει να εκπαιδευτεί από τα γεγονότα. Όταν αυτή η κοινωνία επιτρέψει στους ανθρώπους που καινοτομούν σκληροπυρηνικά να επιτύχουν, η συλλογική νοοτροπία θα αλλάξει. Απλά χρειαζόμαστε ένα μάτσο γεγονότα και μια διαδικασία....

Το DeepSeek τα κατάφερε! Το OpenAI παραδέχεται το λάθος του κλειστού κώδικα, το πλεονέκτημα της πρωτοπορίας γίνεται μικρότερο

Το DeepSeek τα κατάφερε! Το OpenAI παραδέχεται το λάθος του κλειστού κώδικα, το πλεονέκτημα της πρωτοπορίας γίνεται μικρότερο

Αφού το OpenAI κυκλοφόρησε το μοντέλο o3-mini, ο CEO Sam Altman, ο Chief Research Officer Mark Chen, ο Chief Product Officer Kevin Weil, ο Vice President of Engineering Srinivas Narayanan, η Head of API Research Michelle Pokrass, και ο Head of Research Hongyu Ren, διεξήγαγαν ένα online τεχνικό Q&A στο reddit, ένα από τα μεγαλύτερα ολοκληρωμένα φόρουμ στον κόσμο. Τα κύρια θέματα...

OpenAI o3-mini vs. DeepSeek-R1: Ποιος είναι ο βασιλιάς της νέας γενιάς μοντέλων τεχνητής νοημοσύνης;

OpenAI o3-mini vs. DeepSeek-R1: Ποιος είναι ο βασιλιάς της νέας γενιάς μοντέλων τεχνητής νοημοσύνης;

Το o3-mini είναι εδώ, με τη δυναμική ενός διεκδικητή Στις 31 Ιανουαρίου, η OpenAI κυκλοφόρησε το ολοκαίνουργιο μεγάλο μοντέλο o3-mini και παρείχε ορισμένες από τις λειτουργίες του δωρεάν σε όλους τους χρήστες του ChatGPT. Αν και υπάρχει περιορισμός στον αριθμό των ερωτημάτων, επιτρέπει στους χρήστες να γνωρίσουν το τελευταίο εμπορικό μοντέλο του OpenAI το συντομότερο δυνατό....

Πρώτη εκτόξευση! Η SiliconFlow X Huawei Cloud λανσάρει από κοινού τις υπηρεσίες εξαγωγής συμπερασμάτων DeepSeek R1 & V3 με βάση το Ascend Cloud!

Πρώτη εκτόξευση! Η SiliconFlow X Huawei Cloud λανσάρει από κοινού τις υπηρεσίες εξαγωγής συμπερασμάτων DeepSeek R1 & V3 με βάση το Ascend Cloud!

Τα DeepSeek-R1 και DeepSeek-V3 έχουν προκαλέσει παγκόσμια αίσθηση από την κυκλοφορία τους σε ανοικτό κώδικα. Είναι ένα δώρο από την ομάδα DeepSeek σε όλη την ανθρωπότητα και χαιρόμαστε ειλικρινά για την επιτυχία τους. Μετά από μέρες σκληρής δουλειάς από τις ομάδες Silicon Mobility και Huawei Cloud, σήμερα δίνουμε και στους Κινέζους χρήστες ένα κινέζικο...

Μια ολοκληρωμένη σύγκριση των πρόσφατα κυκλοφορηθέντων o3-mini και DeepSeek R1 της OpenAI

Μια ολοκληρωμένη σύγκριση των πρόσφατα κυκλοφορηθέντων o3-mini και DeepSeek R1 της OpenAI

Η OpenAI κυκλοφόρησε το τελευταίο μοντέλο συμπερασμού, το o3-mini, το οποίο είναι βελτιστοποιημένο για τομείς όπως η επιστήμη, τα μαθηματικά και ο προγραμματισμός, παρέχοντας ταχύτερη απόκριση, μεγαλύτερη ακρίβεια και χαμηλότερο κόστος. Σε σύγκριση με τον προκάτοχό του o1-mini, το o3-mini έχει βελτιώσει σημαντικά τις δυνατότητες εξαγωγής συμπερασμάτων, ειδικά στην επίλυση σύνθετων προβλημάτων. Οι δοκιμαστές προτιμούν τις απαντήσεις του o3-mini κατά 56% και το ποσοστό σφάλματος έχει...

Στον κύκλο της τεχνητής νοημοσύνης, το DeepSeek R1 ξεπέρασε σταθερά τους o1 και Claude στις φυσικές δοκιμές και έχουμε εισέλθει στη χρυσή εποχή του RL.

Κανείς μας δεν περίμενε ότι έτσι θα ξεκινούσε το 2025 στον τομέα της τεχνητής νοημοσύνης. Το DeepSeek R1 είναι πραγματικά εκπληκτικό! Πρόσφατα, η "μυστηριώδης ανατολική δύναμη" DeepSeek "ελέγχει σκληρά" τη Silicon Valley. Ζήτησα από τον R1 να εξηγήσει λεπτομερώς το Πυθαγόρειο θεώρημα. Όλα αυτά έγιναν από την AI σε λιγότερο από 30 δευτερόλεπτα χωρίς καμία...

Έκτακτη είδηση! Το OpenAI κυκλοφόρησε σήμερα 2 νέα μοντέλα συμπερασμού: o3-mini και o3-mini-high.

Έκτακτη είδηση! Το OpenAI κυκλοφόρησε σήμερα 2 νέα μοντέλα συμπερασμού: o3-mini και o3-mini-high.

Τα o3-mini και o3-mini (high) θα κυκλοφορήσουν σήμερα. Οι τακτικοί χρήστες θα αποκτήσουν επίσης το o3-mini και οι plus χρήστες θα μπορούν να χρησιμοποιούν το o3-mini (high). Το o3-mini (high) είναι περίπου 200 βαθμούς υψηλότερο από το o1 στο Codeforce, ταχύτερο από το o1 και έχει καλύτερες επιδόσεις στον προγραμματισμό και τα μαθηματικά, αλλά το κόστος εξακολουθεί να είναι στο επίπεδο του o1-mini....

Altman: Κάναμε λάθος για την τεχνητή νοημοσύνη ανοιχτού κώδικα! Το DeepSeek έκανε το OpenAI λιγότερο πλεονεκτικό, και το επόμενο είναι το GPT-5

Altman: Κάναμε λάθος για την τεχνητή νοημοσύνη ανοιχτού κώδικα! Το DeepSeek έκανε το OpenAI λιγότερο πλεονεκτικό, και το επόμενο είναι το GPT-5

Το o3-mini έφτασε αργά το βράδυ και η OpenAI αποκάλυψε τελικά το τελευταίο της ατού. Κατά τη διάρκεια ενός Reddit AMA Q&A, ο Altman εξομολογήθηκε βαθιά ότι είχε σταθεί στη λάθος πλευρά της τεχνητής νοημοσύνης ανοιχτού κώδικα. Είπε ότι η εσωτερική στρατηγική του ανοιχτού κώδικα εξετάζεται και το μοντέλο θα συνεχίσει να αναπτύσσεται, αλλά...

Paper-DeepSeek-R1: Κίνητρα για την ικανότητα συλλογισμού σε LLMs μέσω ενισχυτικής μάθησης

Περίληψη Το παρόν έγγραφο παρουσιάζει τα μοντέλα συλλογιστικής πρώτης γενιάς του DeepSeek: DeepSeek-R1-Zero και DeepSeek-R1. Το DeepSeek-R1-Zero, εκπαιδευμένο μέσω ενισχυτικής μάθησης (RL) μεγάλης κλίμακας χωρίς επιτηρούμενη λεπτομερή ρύθμιση (SFT), επιδεικνύει αξιοσημείωτες ικανότητες συλλογιστικής. Μέσω της RL, αναπτύσσει φυσικά ισχυρές συμπεριφορές συλλογισμού. Ωστόσο, αντιμετωπίζει προκλήσεις όπως η κακή αναγνωσιμότητα και η ανάμειξη της γλώσσας. Για την αντιμετώπιση αυτών των ζητημάτων και την ενίσχυση των επιδόσεων συλλογιστικής, αναπτύχθηκε το DeepSeek-R1,...