Η Google κυκλοφόρησε τρία νέα μοντέλα ταυτόχρονα: το Gemini-2.0-Pro είναι δωρεάν, έχει εξαιρετική βαθμολογία και κατατάσσεται στην πρώτη θέση και είναι κατάλληλο για κωδικοποίηση και επεξεργασία σύνθετων μηνυμάτων!

Η ιστορία του Gemi n i 2.0 επιταχύνεται.

Η έκδοση Flash Thinking Experimental τον Δεκέμβριο έφερε στους προγραμματιστές ένα λειτουργικό μοντέλο με χαμηλό λανθάνοντα χρόνο και υψηλή απόδοση.

Νωρίτερα φέτος, το 2.0 Flash Thinking Experimental ενημερώθηκε στο Google AI Studio για να βελτιώσει περαιτέρω την απόδοση συνδυάζοντας την ταχύτητα του Flash με βελτιωμένες δυνατότητες συμπερασμάτων.

Την περασμένη εβδομάδα, η ενημερωμένη έκδοση 2.0 Flash κυκλοφόρησε πλήρως στις εφαρμογές Gemini για υπολογιστές και κινητά.

Σήμερα, τρία νέα μέλη έχουν αποκαλυφθεί ταυτόχρονα: η πειραματική έκδοση του Gemini 2.0 Pro, η οποία μέχρι στιγμής έχει καλύτερες επιδόσεις στην κωδικοποίηση και τα πολύπλοκα μηνύματα, η οικονομικά αποδοτική έκδοση 2.0 Flash-Lite και η βελτιωμένη έκδοση 2.0 Flash Thinking.

Το Gemini 2.0 Pro κατατάσσεται πρώτο σε όλες τις κατηγορίες. Το Gemini-2.0-Flash κατατάσσεται στις τρεις πρώτες θέσεις σε κωδικοποίηση, μαθηματικά και παζλ. Το Flash-lite κατατάσσεται στην πρώτη δεκάδα σε όλες τις κατηγορίες.

Ένα γράφημα σύγκρισης των ικανοτήτων των τριών μοντέλων:

Όλα τα μοντέλα υποστηρίζουν πολυτροπικό κείμενο εισαγωγής και εξόδου.

Περισσότερες τροπικές ικανότητες είναι στο δρόμο. Διάγραμμα ισχύος μοντέλου στην αρένα κωδικοποίησης

Χάρτης θερμότητας ρυθμού νίκης

Η Google αντιμετωπίζει τους δωρεάν χρήστες καλύτερα από ό,τι το OpenAI στους χρήστες Plus. Δωρεάν πρόσβαση στο Gemini 2.0 Pro Experimental στο AI Studio:

Κάντε κλικ για να παίξετε

Η υπηρεσία Deepseek εμφανίζει πάντα ένα σφάλμα σε αναμονή… Να θυμάστε ότι το πρώτο μοντέλο χωρίς συμπεράσματα ήταν επίσης το Flash Thinking 2.0, το οποίο χρησιμοποιήθηκε στο Google aistudio.

Επιπλέον, υπάρχει το web έκδοση του Gemini:

Υπάρχει επίσης ένα συνδεδεμένο μοντέλο συμπερασμάτων (άρα γιατί να το διαχωρίσετε…)

Η Google κυκλοφόρησε την πειραματική έκδοση του Gemini 2.0 Pro και η βελτίωση στις επίσημες δοκιμές αναφοράς είναι αρκετά εντυπωσιακή.

Έχει τις πιο ισχυρές δυνατότητες κωδικοποίησης και την ικανότητα να επεξεργάζεται πολύπλοκα μηνύματα και έχει καλύτερη ικανότητα κατανόησης και λογικής της παγκόσμιας γνώσης από οποιοδήποτε μοντέλο που έχει κυκλοφορήσει μέχρι στιγμής η Google.

Έχει το μεγαλύτερο παράθυρο περιβάλλοντος (200k, και το μακρύ περιβάλλον μου είναι ένα σχετικά μεγάλο πλεονέκτημα του μοντέλου Gemini), το οποίο του επιτρέπει να αναλύει και να κατανοεί διεξοδικά μεγάλο όγκο πληροφοριών και να καλεί εργαλεία όπως η αναζήτηση Google και η εκτέλεση κώδικα.

Στη δοκιμή MATH, πέτυχε 91,8%, αύξηση περίπου 5 ποσοστιαίων μονάδων σε σχέση με την έκδοση 1.5. Η ικανότητα συλλογιστικής GPQA έφτασε τα 64,7% και το παγκόσμιο τεστ γνώσεων SimpleQA έφτασε ακόμη και το 44,3%.

Το πιο αξιοσημείωτο είναι η ικανότητα προγραμματισμού. Πέτυχε 36,0% στη δοκιμή LiveCodeBench και η ακρίβεια μετατροπής Bird-SQL ξεπέρασε τα 59,3%. Σε συνδυασμό με το εξαιρετικά μεγάλο παράθυρο περιβάλλοντος των 2 εκατομμυρίων διακριτικών, είναι αρκετό για να χειριστείτε τις πιο σύνθετες εργασίες ανάλυσης κώδικα.

Μπορείτε να το δοκιμάσετε στον κέρσορα.

Η ικανότητα κατανόησης πολλών γλωσσών είναι επίσης εντυπωσιακή, με βαθμολογία παγκόσμιας δοκιμής MMLU 86,5%. Το MMMU κατανόησης εικόνας είναι 72,7% και η ικανότητα ανάλυσης βίντεο είναι 71,9%.

Το Gemini 2.0 Flash-Lite είναι μια ενδιαφέρουσα ισορροπία.

Διατηρεί την ταχύτητα και το κόστος του 1,5 Flash, αλλά φέρνει καλύτερη απόδοση. Το παράθυρο περιβάλλοντος με 1 εκατομμύριο μάρκες του επιτρέπει να επεξεργάζεται περισσότερες πληροφορίες.

Το πιο πρακτικό είναι η αναλογία τιμής/απόδοσης: η δημιουργία λεζάντας για 40.000 φωτογραφίες κοστίζει λιγότερο από $1. Αυτό κάνει το AI πιο προσγειωμένο.

Η Blogger Shrivastava ανέφερε: Η κωδικοποίηση Gemini 2.0 Pro είναι τρελή!

Συμβουλή: χρησιμοποιήστε το Three.js για να δημιουργήσετε μια προσομοίωση ηλιακού συστήματος. Προσθέστε μια κλίμακα χρόνου, ένα αναπτυσσόμενο μενού εστίασης, εμφανίστε τροχιές και εμφανίστε ετικέτες. Δημιουργήστε τα πάντα σε ένα αρχείο, ώστε να μπορώ να το επικολλήσω σε ένα ηλεκτρονικό πρόγραμμα επεξεργασίας και να προβάλω την έξοδο.

Επιπλέον, ορισμένοι χρήστες ανέφεραν ότι το Gemini 2.0 Flash είχε καλύτερα αποτελέσματα σε ένα από τα δικά του τεστ παράδοξων:

Τέλος, η Google ανέφερε ότι η ασφάλεια του Gemini 2.0, όχι μόνο το patch, βρίσκεται στον πυρήνα του σχεδιασμού από την αρχή.

Αφήστε το μοντέλο να μάθει να κάνει αυτοκριτική. Χρησιμοποιήστε την ενισχυτική μάθηση για να αφήσετε τον Δίδυμο να αξιολογήσει τις δικές του απαντήσεις και να παρέχει πιο ακριβή σχόλια. Αυτό το καθιστά πιο ισχυρό όταν ασχολείστε με ευαίσθητα θέματα.

Οι αυτοματοποιημένες δοκιμές της κόκκινης ομάδας είναι ενδιαφέρουσες. Έχει σχεδιαστεί ειδικά για να αποτρέπει την έγχυση έμμεσων προτρεπτικών λέξεων, κάτι που είναι σαν να εξοπλίζεις την τεχνητή νοημοσύνη με ένα ανοσοποιητικό σύστημα για να εμποδίζει κάποιον να κρύβει κακόβουλες εντολές στα δεδομένα.

Uncategorized

OpenAI o3-mini vs. DeepSeek-R1: Ποιος είναι ο βασιλιάς της νέας γενιάς μοντέλων τεχνητής νοημοσύνης;

Μεzddeepseeker Φεβρουάριος 1, 2025Φεβρουάριος 1, 2025

Το o3-mini είναι εδώ, με τη δυναμική ενός διεκδικητή Στις 31 Ιανουαρίου, η OpenAI κυκλοφόρησε το ολοκαίνουργιο μεγάλο μοντέλο o3-mini και παρείχε ορισμένες από τις λειτουργίες του δωρεάν σε όλους τους χρήστες του ChatGPT. Αν και υπάρχει περιορισμός στον αριθμό των ερωτημάτων, επιτρέπει στους χρήστες να γνωρίσουν το τελευταίο εμπορικό μοντέλο του OpenAI το συντομότερο δυνατό....

Uncategorized

Τι μπορεί να πετύχει το Deepseek; Ακόμα και το OpenAI δεν μπορεί να το κάνει;

Μεzddeepseeker Φεβρουάριος 10, 2025Φεβρουάριος 10, 2025

Η πραγματική τιμή του DeepSeek υποτιμάται! Το DeepSeek-R1 έφερε αναμφίβολα ένα νέο κύμα ενθουσιασμού στην αγορά. Όχι μόνο οι σχετικοί αποκαλούμενοι στόχοι δικαιούχων αυξάνονται απότομα, αλλά μερικοί άνθρωποι έχουν αναπτύξει ακόμη και μαθήματα και λογισμικό που σχετίζονται με το DeepSeek σε μια προσπάθεια να κερδίσουν χρήματα από αυτό. Πιστεύουμε ότι αν και αυτά τα φαινόμενα έχουν μια…

Uncategorized

Αποκαλύφθηκε η τεχνολογία DeepSeek-R1: οι βασικές αρχές του χαρτιού αναλύονται και το κλειδί για την πρωτοποριακή απόδοση του μοντέλου αποκαλύπτεται

Μεzddeepseeker Φεβρουάριος 9, 2025Φεβρουάριος 9, 2025

Σήμερα θα μοιραστούμε το DeepSeek R1, Τίτλος: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Ενθάρρυνση της συλλογιστικής ικανότητας του LLM μέσω ενισχυτικής μάθησης. Αυτό το άρθρο παρουσιάζει την πρώτη γενιά μοντέλων συλλογισμού του DeepSeek, DeepSeek-R1-Zero και DeepSeek-R1. Το μοντέλο DeepSeek-R1-Zero εκπαιδεύτηκε μέσω μεγάλης κλίμακας ενισχυτικής εκμάθησης (RL) χωρίς εποπτευόμενη λεπτομέρεια (SFT) ως αρχικό βήμα,…

Uncategorized

Τι είναι το FlashMLA; Ένας ολοκληρωμένος οδηγός για τον αντίκτυπό του στους πυρήνες αποκωδικοποίησης AI

Μεdeepseeker Φεβρουάριος 24, 2025Φεβρουάριος 24, 2025

Το FlashMLA έχει κερδίσει γρήγορα την προσοχή στον κόσμο της τεχνητής νοημοσύνης, ιδιαίτερα στον τομέα των μεγάλων γλωσσικών μοντέλων (LLMs). Αυτό το καινοτόμο εργαλείο, που αναπτύχθηκε από την DeepSeek, χρησιμεύει ως ένας βελτιστοποιημένος πυρήνας αποκωδικοποίησης που έχει σχεδιαστεί για GPUs Hopper—τσιπ υψηλής απόδοσης που χρησιμοποιούνται συνήθως σε υπολογισμούς τεχνητής νοημοσύνης. Το FlashMLA εστιάζει στην αποτελεσματική επεξεργασία ακολουθιών μεταβλητού μήκους, καθιστώντας το ιδιαίτερα κατάλληλο…

Uncategorized

Paper-DeepSeek-R1: Κίνητρα για την ικανότητα συλλογισμού σε LLMs μέσω ενισχυτικής μάθησης

Μεdeepseeker Ιανουάριος 29, 2025Ιανουάριος 29, 2025

Περίληψη Το παρόν έγγραφο παρουσιάζει τα μοντέλα συλλογιστικής πρώτης γενιάς του DeepSeek: DeepSeek-R1-Zero και DeepSeek-R1. Το DeepSeek-R1-Zero, εκπαιδευμένο μέσω ενισχυτικής μάθησης (RL) μεγάλης κλίμακας χωρίς επιτηρούμενη λεπτομερή ρύθμιση (SFT), επιδεικνύει αξιοσημείωτες ικανότητες συλλογιστικής. Μέσω της RL, αναπτύσσει φυσικά ισχυρές συμπεριφορές συλλογισμού. Ωστόσο, αντιμετωπίζει προκλήσεις όπως η κακή αναγνωσιμότητα και η ανάμειξη της γλώσσας. Για την αντιμετώπιση αυτών των ζητημάτων και την ενίσχυση των επιδόσεων συλλογιστικής, αναπτύχθηκε το DeepSeek-R1,...

Uncategorized

Πώς δημιουργήθηκε το DeepSeek; Ανάλυση του ιστορικού ανάπτυξης του DeepSeek

Μεzddeepseeker Φεβρουάριος 3, 2025Φεβρουάριος 3, 2025

Στο μέλλον, η καινοτομία θα γίνεται όλο και πιο σκληροπυρηνική. Μπορεί να μην είναι εύκολο να το καταλάβουμε τώρα, επειδή ολόκληρη η κοινωνική ομάδα πρέπει να εκπαιδευτεί από τα γεγονότα. Όταν αυτή η κοινωνία επιτρέψει στους ανθρώπους που καινοτομούν σκληροπυρηνικά να επιτύχουν, η συλλογική νοοτροπία θα αλλάξει. Απλά χρειαζόμαστε ένα μάτσο γεγονότα και μια διαδικασία....

Παρόμοιες θέσεις

Αφήστε μια απάντηση Ακύρωση απάντησης