zddeepseeker - Deepseek R1 - Σελίδα 2 από 3

Uncategorized

Αποκαλύφθηκε η τεχνολογία DeepSeek-R1: οι βασικές αρχές του χαρτιού αναλύονται και το κλειδί για την πρωτοποριακή απόδοση του μοντέλου αποκαλύπτεται

Μεzddeepseeker Φεβρουάριος 9, 2025Φεβρουάριος 9, 2025

Σήμερα θα μοιραστούμε το DeepSeek R1, Τίτλος: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Ενθάρρυνση της συλλογιστικής ικανότητας του LLM μέσω ενισχυτικής μάθησης. Αυτό το άρθρο παρουσιάζει την πρώτη γενιά μοντέλων συλλογισμού του DeepSeek, DeepSeek-R1-Zero και DeepSeek-R1. Το μοντέλο DeepSeek-R1-Zero εκπαιδεύτηκε μέσω μεγάλης κλίμακας ενισχυτικής εκμάθησης (RL) χωρίς εποπτευόμενη λεπτομέρεια (SFT) ως αρχικό βήμα,…

Uncategorized

Ερμηνεία χαρτιού DeepSeek R1 & βασικά τεχνικά σημεία

Μεzddeepseeker Φεβρουάριος 9, 2025Φεβρουάριος 9, 2025

1 Ιστορικό Κατά τη διάρκεια του Εαρινό Φεστιβάλ, το DeepSeek R1 τράβηξε για άλλη μια φορά την ευρεία προσοχή, και ακόμη και το άρθρο ερμηνείας του DeepSeek V3 που γράψαμε προηγουμένως μεταδόθηκε επίσης και συζητήθηκε πολύ. Αν και έχουν γίνει πολλές αναλύσεις και αναπαραγωγές του DeepSeek R1, εδώ αποφασίσαμε να συγκεντρώσουμε κάποιες αντίστοιχες αναγνωστικές σημειώσεις. Θα χρησιμοποιήσουμε τρία…

Το χαμηλού κόστους μοντέλο της Google, η σειρά Gemini 2.0, επιτίθεται: η μάχη για τη σχέση κόστους-αποτελεσματικότητας στα μεγάλα μοντέλα εντείνεται

Uncategorized

Το χαμηλού κόστους μοντέλο της Google, η σειρά Gemini 2.0, επιτίθεται: η μάχη για τη σχέση κόστους-αποτελεσματικότητας στα μεγάλα μοντέλα εντείνεται

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Το υψηλό κόστος χρήσης μεγάλων μοντέλων τεχνητής νοημοσύνης είναι ένας σημαντικός λόγος για τον οποίο πολλές εφαρμογές τεχνητής νοημοσύνης δεν έχουν ακόμη εφαρμοστεί και προωθηθεί. Η επιλογή ακραίων επιδόσεων σημαίνει τεράστιο κόστος υπολογιστικής ισχύος, το οποίο οδηγεί σε υψηλό κόστος χρήσης που οι απλοί χρήστες δεν μπορούν να αποδεχθούν. Ο ανταγωνισμός για μεγάλα μοντέλα AI μοιάζει με πόλεμο χωρίς καπνό. Μετά…

Το Gemini 2.0 κυριαρχεί στα charts, ενώ το DeepSeek V3 κλαίει στην τιμή του και ένας νέος οικονομικός πρωταθλητής γεννιέται!

Uncategorized

Το Gemini 2.0 κυριαρχεί στα charts, ενώ το DeepSeek V3 κλαίει στην τιμή του και ένας νέος οικονομικός πρωταθλητής γεννιέται!

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Η οικογένεια Google Gemini 2.0 ολοκληρώθηκε επιτέλους! Κυριαρχεί στα charts μόλις κυκλοφορήσει. Εν μέσω της καταδίωξης και των αποκλεισμών των Deepseek, Qwen και o3, η Google κυκλοφόρησε τρία μοντέλα με μια κίνηση νωρίς σήμερα το πρωί: Gemini 2.0 Pro, Gemini 2.0 Flash και Gemini 2.0 Flash-Lite. Στη μεγάλη κατάταξη LMSYS μοντέλων, η Gemini…

Διάλογος a16z με 27χρονο CEO: Η AI Agent έχει τεράστιο αποτέλεσμα μόχλευσης και η μακροπρόθεσμη τιμολόγηση θα συνδέεται με το κόστος εργασίας

Uncategorized

Διάλογος a16z με 27χρονο CEO: Η AI Agent έχει τεράστιο αποτέλεσμα μόχλευσης και η μακροπρόθεσμη τιμολόγηση θα συνδέεται με το κόστος εργασίας

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Σημαντικά σημεία Η AI Agent αναδιαμορφώνει την εμπειρία του πελάτη Jesse Zhang: Πώς κατασκευάζεται πραγματικά ένας Agent; Η άποψή μας είναι ότι με την πάροδο του χρόνου, θα γίνεται όλο και περισσότερο σαν ένας Πράκτορας που βασίζεται σε φυσική γλώσσα, επειδή έτσι εκπαιδεύονται τα μεγάλα γλωσσικά μοντέλα (LLM). Μακροπρόθεσμα, εάν έχετε έναν εξαιρετικά έξυπνο πράκτορα που…

Uncategorized

Cathie Wood: Το DeepSeek απλώς επιταχύνει τη διαδικασία μείωσης του κόστους. η ακραία συγκεντρωμένη δομή της αγοράς που συγκρίνεται με τη Μεγάλη Ύφεση θα αλλάξει

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Highlights Ο ανταγωνισμός με το DeepSeek είναι καλός για την Cathie Wood των ΗΠΑ: Νομίζω ότι δείχνει ότι το κόστος της καινοτομίας μειώνεται δραματικά και ότι αυτή η τάση έχει ήδη ξεκινήσει. Για παράδειγμα, πριν από το DeepSeek, το κόστος εκπαίδευσης της τεχνητής νοημοσύνης μειώθηκε κατά 75% ετησίως και το κόστος εξαγωγής συμπερασμάτων μειώθηκε ακόμη και κατά 85% σε…

Uncategorized

Η Google κυκλοφόρησε τρία νέα μοντέλα ταυτόχρονα: το Gemini-2.0-Pro είναι δωρεάν, έχει εξαιρετική βαθμολογία και κατατάσσεται στην πρώτη θέση και είναι κατάλληλο για κωδικοποίηση και επεξεργασία σύνθετων μηνυμάτων!

Μεzddeepseeker Φεβρουάριος 8, 2025Φεβρουάριος 8, 2025

Η ιστορία του Gemini 2.0 επιταχύνεται. Η έκδοση Flash Thinking Experimental τον Δεκέμβριο έφερε στους προγραμματιστές ένα λειτουργικό μοντέλο με χαμηλό λανθάνοντα χρόνο και υψηλή απόδοση. Νωρίτερα φέτος, το 2.0 Flash Thinking Experimental ενημερώθηκε στο Google AI Studio για να βελτιώσει περαιτέρω την απόδοση συνδυάζοντας την ταχύτητα του Flash με βελτιωμένες δυνατότητες συμπερασμάτων. Την περασμένη εβδομάδα,…

Uncategorized

Ο Ali Qwen2.5-Max προσπερνά το DeepSeek-V3! Netizen: Η τεχνητή νοημοσύνη της Κίνας κλείνει γρήγορα το χάσμα

Μεzddeepseeker Φεβρουάριος 5, 2025Φεβρουάριος 5, 2025

Μόλις τώρα, ένα άλλο εγχώριο μοντέλο προστέθηκε στη λίστα του Big Model Arena από την Ali, το Qwen2.5-Max, το οποίο ξεπέρασε το DeepSeek-V3 και κατέλαβε την έβδομη θέση στη γενική κατάταξη με συνολική βαθμολογία 1332. Ξεπέρασε επίσης μοντέλα όπως το Claude 3.5 Sonnet και το Llama 3.1 σε 40 fee. Ειδικότερα, διαπρέπει στον προγραμματισμό…

Έκτακτα νέα! Ο ερευνητής του DeepSeek αποκαλύπτει στο διαδίκτυο: Η εκπαίδευση R1 χρειάστηκε μόνο δύο έως τρεις εβδομάδες και μια ισχυρή εξέλιξη του μηδενικού R1 παρατηρήθηκε κατά τη διάρκεια των διακοπών της Κινεζικής Πρωτοχρονιάς

Uncategorized

Έκτακτα νέα! Ο ερευνητής του DeepSeek αποκαλύπτει στο διαδίκτυο: Η εκπαίδευση R1 χρειάστηκε μόνο δύο έως τρεις εβδομάδες και μια ισχυρή εξέλιξη του μηδενικού R1 παρατηρήθηκε κατά τη διάρκεια των διακοπών της Κινεζικής Πρωτοχρονιάς

Μεzddeepseeker Φεβρουάριος 4, 2025Φεβρουάριος 4, 2025

Έκτακτα νέα! Ο ερευνητής του DeepSeek αποκαλύπτει διαδικτυακά: Η εκπαίδευση R1 χρειάστηκε μόνο δύο έως τρεις εβδομάδες και παρατηρήθηκε μια ισχυρή εξέλιξη του μηδενικού R1 κατά τη διάρκεια των διακοπών της Κινεζικής Πρωτοχρονιάς Μόλις τώρα, παρατηρήσαμε ότι η ερευνήτρια του DeepSeek Daya Guo απάντησε στις ερωτήσεις των χρηστών σχετικά με το DeepSeek R1 και τα σχέδια της εταιρείας πηγαίνοντας μπροστά. Μπορούμε μόνο να πούμε…

Το DeepSeek R1 ήρθε πρώτο στο τεστ δημιουργικής γραφής και το o3 mini ήταν ακόμα χειρότερο από το o1 mini!

Uncategorized

Το DeepSeek R1 ήρθε πρώτο στο τεστ δημιουργικής γραφής και το o3 mini ήταν ακόμα χειρότερο από το o1 mini!

Μεzddeepseeker Φεβρουάριος 3, 2025Φεβρουάριος 3, 2025

Το DeepSeek R1 κέρδισε το πρωτάθλημα στο τεστ αναφοράς δημιουργικής γραφής διηγήματος, ξεπερνώντας με επιτυχία τον προηγούμενο κυρίαρχο παίκτη Claude 3.5 Sonnet! Τεστ αναφοράς Το τεστ αναφοράς που σχεδίασε ο ερευνητής Lech Mazur δεν είναι ένας συνηθισμένος διαγωνισμός γραφής. Κάθε μοντέλο τεχνητής νοημοσύνης έπρεπε να ολοκληρώσει 500 μικρές ιστορίες και κάθε ιστορία έπρεπε να ενσωματώνει έξυπνα...