Το Google Gemini 2.0 η οικογένεια επιτέλους ολοκληρώθηκε! Κυριαρχεί στα charts μόλις κυκλοφορήσει.

Εν μέσω της καταδίωξης και των αποκλεισμών του Deepseek, Qwen και o3, η Google κυκλοφόρησε τρία μοντέλα με μια κίνηση νωρίς σήμερα το πρωί: Gemini 2.0 Pro, Gemini 2.0 Flash και Gemini 2.0 Flash-Lite.

Στη μεγάλη κατάταξη LMSYS μοντέλων, το Gemini 2.0-Pro έχει φτάσει στην κορυφή και η οικογένεια Gemini-2.0 έχει προχωρήσει στην πρώτη 10άδα.

Ας δούμε πρώτα την απόδοση του μοντέλου

Το Μοντέλα Gemini 2.0 που κυκλοφόρησε αυτή τη φορά όλα έχουν τα δικά τους highlights όσον αφορά την απόδοση!

Gemini 2.0 Pro (Πειραματικό)

Όπως το εμβληματικό μοντέλο της σειράς Gemini, η έκδοση Pro αντιπροσωπεύει τις πιο προηγμένες δυνατότητες AI της Google και υπερέχει κωδικοποίηση και συμπέρασμα προπαντός:

  • Εξαιρετικά μεγάλο παράθυρο περιβάλλοντος: υποστηρίζει την επεξεργασία περιβάλλοντος έως 2M μάρκες
  • Ισχυρή ενσωμάτωση εργαλείων: ενσωματώνει σε βάθος την αναζήτηση Google και την εκτέλεση κώδικα
  • Διαθεσιμότητα: ήδη διαθέσιμη ως πειραματική έκδοση στο Google AI Studio, στο Vertex AI και στην πλατφόρμα Gemini Advanced

Gemini 2.0 Flash

τοποθετείται ως α “Υψηλά αποδοτικό άλογο εργασίας”. Έχει σχεδιαστεί με έμφαση στην εξισορρόπηση της ταχύτητας και της απόδοσης και προορίζεται να παρέχει ιδανική υποστήριξη για σενάρια εφαρμογών που απαιτούν αποκρίσεις χαμηλής καθυστέρησης:

  • Εκατομμύρια παράθυρα περιβάλλοντος: Υποστηρίζει το πλαίσιο 1M tokens
  • Εξαιρετικές πολυτροπικές δυνατότητες συμπερασμάτων: Καλό στην επεξεργασία πολυτροπικών δεδομένων, υποστηρίζει επί του παρόντος πολυτροπική εισαγωγή και εισαγωγή κειμένου με μία μορφή
  • Μελλοντική επέκταση χαρακτηριστικών: Οι λειτουργίες δημιουργίας εικόνας και μετατροπής κειμένου σε ομιλία θα είναι σύντομα διαθέσιμες
  • Διαθεσιμότητα: Κυκλοφόρησε επίσημα στις πλατφόρμες Vertex AI Studio και Google AI Studio και είναι προσβάσιμη μέσω του Gemini API.

Gemini 2.0 Flash-Lite (Προεπισκόπηση)

Ως το πιο «οικονομικό» μοντέλο, το Flash-Lite προσφέρει την καλύτερη ισορροπία μεταξύ ταχύτητας, κόστους και απόδοσης.

  • Οικονομικά πλεονεκτήματα: Ενώ διατηρεί την ίδια ταχύτητα και κόστος με το 1.5 Flash, ξεπερνά τις επιδόσεις του Flash 1.5 στις περισσότερες δοκιμές αναφοράς.
  • Παράθυρο περιβάλλοντος εκατομμυρίου επιπέδων: Υποστηρίζει επίσης 1M διακριτικά ισχύος επεξεργασίας περιβάλλοντος.

Σύμφωνα με τη σύγκριση αξιολόγησης απόδοσης που κυκλοφόρησε από την Google, η πειραματική έκδοση Gemini 2.0 Pro πέτυχε τις υψηλότερες βαθμολογίες σχεδόν σε όλες τις δοκιμές αναφοράς, έχοντας εξαιρετική απόδοση:

Είχε ιδιαίτερα καλή απόδοση σε εργασίες δημιουργίας κώδικα (όπως το LiveCodeBench v5) και σε πολύπλοκα μαθηματικά προβλήματα (όπως άλγεβρα, γεωμετρία και λογισμός). Επιπλέον, υπήρξε σημαντική βελτίωση στο τεστ κατανόησης πολύπλοκων μεγάλων εγγράφων.

Και η τιμολόγηση

Η Google είναι επίσης ένας ευσυνείδητος κατασκευαστής όσον αφορά τη σχέση κόστους-αποτελεσματικότητας του API.

Τα εκατομμύρια διακριτικά του Gemini 2.0 Flash κοστίζουν λιγότερο από ένα δολάριο… Υποστηρίζει πολλαπλές λειτουργίες, δικτυωμένες αναζητήσεις και ένα πρωτόγνωρο παράθυρο περιβάλλοντος.

Αντίθετα, το Deepseek V3 κοστίζει επί του παρόντος ένα δολάριο για ένα εκατομμύριο μάρκες και το συμπέρασμα R1 κοστίζει τέσσερα δολάρια.

ΥΓ: Αλλά και πάλι θέλω να ευχαριστήσω την DeepSeek για τη μείωση της τιμής. Όποιος μπορεί να μειώσει την τιμή είναι οικογένεια.

Αυτό είναι πραγματικά πολύ φθηνό! Σε σύγκριση με την απόδοση, νομίζω ότι αυτό που έχει παραβλεφθεί στο Gemini είναι η τιμή!

Απόδοση θήκης

Δεδομένου ότι ισχυρίζεται ότι είναι τόσο καλό όσο το Deepseek, πρέπει οπωσδήποτε να δούμε πώς αποδίδει πραγματικά σε περιπτώσεις και να δούμε πώς το έχουν δοκιμάσει διάφοροι χρήστες του Διαδικτύου

Ένα παιχνίδι φλίπερ βασισμένο στη φυσική

Ας δούμε πρώτα αυτή τη δημοφιλή περίπτωση, η οποία χρησιμοποιεί μια μηχανή φυσικής για να προσομοιώνει ρεαλιστικά εφέ όπως συγκρούσεις, τριβή και βαρύτητα.

Συμβουλή: Γράψτε ένα πρόγραμμα Python που εμφανίζει μια μπάλα να αναπηδά μέσα σε ένα περιστρεφόμενο εξάγωνο. Η μπάλα πρέπει να επηρεάζεται από τη βαρύτητα και την τριβή και πρέπει να αναπηδά ρεαλιστικά από τους περιστρεφόμενους τοίχους

Έτσι αποδίδουν τα Deepseek R1 και o3-min:

Η έκδοση που δημιουργήθηκε από το Gemini 2.0 Pro Experimental:

Τα υπόλοιπα δύο μοντέλα δεν έχουν καλή απόδοση

Διπλάσια δυσκολία! Κάνε την μπάλα να χωριστεί σε 100 μπάλες!

Συμβουλή: Γράψτε ένα σενάριο για 100 φωτεινές κίτρινες μπάλες που αναπηδούν μέσα σε μια σφαίρα, φροντίζοντας να χειριστείτε σωστά την ανίχνευση σύγκρουσης. Κάντε τη σφαίρα να περιστρέφεται αργά. Βεβαιωθείτε ότι οι μπάλες παραμένουν μέσα στη σφαίρα. Εφαρμογή στο p5.js

Μπράβο! Η αργή περιστροφή της σφαίρας είναι πολύ ομαλή και η προσομοίωση των φυσικών νόμων είναι εξαιρετική. Οι 100 μπάλες συγκρούονται επίσης σταθερά και «κάνουν τη δουλειά τους» ~

Γράψτε ένα σενάριο p5.js για να προσομοιώσετε 25 σωματίδια που αναπηδούν σε χώρο κενού μέσα σε ένα κυλινδρικό δοχείο. Χρησιμοποιήστε διαφορετικό χρώμα για κάθε μπάλα και βεβαιωθείτε ότι αφήνουν ένα ίχνος για να δείξουν την κίνησή τους. Προσθέστε μια αργή περιστροφή του δοχείου για να παρατηρήσετε καλύτερα τι συμβαίνει στη σκηνή. Φροντίστε να δημιουργήσετε κατάλληλους κανόνες ανίχνευσης σύγκρουσης και φυσικής για να διασφαλίσετε ότι τα σωματίδια παραμένουν μέσα στο δοχείο. Προσθέστε ένα εξωτερικό σφαιρικό δοχείο. Προσθέστε ένα αργό εφέ μεγέθυνσης και σμίκρυνσης σε ολόκληρη τη σκηνή.

Μια ερώτηση δοκιμής φράουλας που δεν μπορεί να παρακαμφθεί

Και οι έξυπνοι (πονηροί) δικτυακοί χρήστες πέταξαν ξανά το κλασικό τεστ φράουλας:

Πόσα r υπάρχουν στη φράουλα

Και το Gemini 2.0 Flash Thinking Experimental πήρε τη σωστή απάντηση:

Το αφεντικό της Google, Τζεφ Ντιν, δοκίμασε προσωπικά τις προγραμματιστικές του ικανότητες

Ο Jeff Dean, επικεφαλής επιστήμονας στο Google DeepMind και στο Google Research, δοκίμασε επίσης τις δεξιότητες προγραμματισμού ενός κύματος Gemini 2.0 Pro:

Έβαλε το μοντέλο να ολοκληρώσει το κλασικό παιχνίδι Boggle και ο κώδικας δημιουργήθηκε την πρώτη φορά που ολοκληρώθηκε βρίσκοντας όλες τις έγκυρες λέξεις στο «Τετράγωνο γραμμάτων» παιχνίδι:

Επιπλέον, ο Jeff Dean είπε ότι ο κώδικας ολοκληρώθηκε σε μόλις 18,9 δευτερόλεπτα, κάτι που είναι πολύ γρήγορο.

Ο Διευθύνων Σύμβουλος του Google DeepMind είναι γεμάτος εμπιστοσύνη σε αυτή τη σημαντική ενημέρωση του μοντέλου, λέγοντας ότι αυτή η έκδοση θέτει τα θεμέλια για την Google για να επιτύχει μελλοντική μελλοντική εργασία έξυπνου πράκτορα:

Ο διευθύνων σύμβουλος της Google, Sundar Pichai, είχε προηγουμένως ξεκαθαρίσει ότι το 2025 θα είναι μια κρίσιμη περίοδος για την Google να επιταχύνει την ανάπτυξη στον τομέα της τεχνητής νοημοσύνης. Αισθάνεται σαν μετά από αυτήν την έκδοση, η διαδρομή της Google είναι πιο ξεκάθαρη!

Σε σύγκριση με τις διαδρομές άλλων κολοσσών, η διαδρομή AI της Google εστιάζει περισσότερο στην πρακτικότητα και παρέχει άμεσα πολλαπλές επιλογές έκδοσης, όπως ακριβώς μια εργαλειοθήκη AI, όπου μπορείτε να επιλέξετε και να επιλέξετε όπως θέλετε, σύμφωνα με τις ανάγκες σας, ευέλικτο και βολικό, και ικανή να καλύψει κάθε είδους ανάγκες.

Παρόμοιες θέσεις

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *