Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!

ה Google Gemini 2.0 סוף סוף המשפחה הושלמה! הוא שולט במצעדים ברגע שהוא שוחרר.

בתוך המרדף והחסימות של חיפוש עמוק, Qwen ו-o3, גוגל פרסמה שלושה דגמים במכה אחת מוקדם הבוקר: Gemini 2.0 Pro, Gemini 2.0 Flash ו-Gemini 2.0 Flash-Lite.

בדירוג הדגמים הגדולים של LMSYS, Gemini 2.0-Pro הגיע לפסגה, ומשפחת Gemini-2.0 התקדמה כולן ל-10 המובילים.

תוֹכֶן הָעִניָנִים

בואו נסתכל תחילה על ביצועי הדגם

ה דגמי Gemini 2.0 שיצאו הפעם לכולם יש את השיאים שלהם מבחינת ביצועים!

Gemini 2.0 Pro (ניסיוני)

בתור ה דגם דגל מסדרת Gemini, גרסת ה-Pro מייצגת את יכולות הבינה המלאכותית המתקדמות ביותר של גוגל, ומצטיינת בה קידוד והסקת מסקנות בִּפְרָט:

חלון הקשר גדול במיוחד: תומך בעיבוד הקשר של עד אסימונים של 2M
שילוב כלי רב עוצמה: משלב באופן עמוק את חיפוש Google וביצוע קוד
זְמִינוּת: כבר זמין כגרסה ניסיונית ב-Google AI Studio, Vertex AI ופלטפורמת Gemini Advanced

Gemini 2.0 פלאש

ממוקמת בתור א "סוס עבודה יעיל ביותר". הוא תוכנן תוך התמקדות באיזון מהירות וביצועים, ונועד לספק תמיכה אידיאלית עבור תרחישי יישומים הדורשים תגובות עם אחזור נמוך:

מיליוני חלונות הקשר: תומך בהקשר של 1M אסימונים
יכולות מסקנות מולטי-מודאליות מצוינות: טוב בעיבוד נתונים רב-מודאליים, תומך כיום בקלט רב-מודאלי ובקלט טקסט חד-מודאלי
הרחבת תכונה עתידית: פונקציות יצירת תמונות וטקסט לדיבור יהיו זמינות בקרוב
זְמִינוּת: שוחרר רשמית בפלטפורמות Vertex AI Studio ו-Google AI Studio, וניתן לגשת אליו דרך ה-API של Gemini.

Gemini 2.0 Flash-Lite (תצוגה מקדימה)

בתור הדגם "החסכוני ביותר", Flash-Lite מציע את האיזון הטוב ביותר בין מהירות, עלות וביצועים.

יתרונות חסכוניים: תוך שמירה על אותה מהירות ועלות כמו 1.5 פלאש, הוא מתעלה על 1.5 פלאש ברוב מבחני הבנצ'מרק.
חלון הקשר ברמת מיליון: תומך גם ב-1M אסימונים של כוח עיבוד הקשר.

על פי השוואת הערכת הביצועים שפרסמה גוגל, גרסת Gemini 2.0 Pro Experimental השיגה את הציונים הגבוהים ביותר כמעט בכל מבחני הבנצ'מרק, עם ביצועים מצוינים:

הוא פעל טוב במיוחד במשימות יצירת קוד (כגון LiveCodeBench v5) ובבעיות מתמטיות מורכבות (כגון אלגברה, גיאומטריה וחשבון). בנוסף, חל שיפור משמעותי במבחן ההבנה של מסמכים ארוכים מורכבים.

וגם התמחור

גוגל היא גם יצרנית מצפונית מבחינת עלות-תועלת API.

מיליון האסימונים של Gemini 2.0 Flash עולים פחות מדולר אחד... הוא תומך במספר מצבים, חיפושים ברשת וחלון הקשר חסר תקדים.

לעומת זאת, Deepseek V3 עולה כיום דולר אחד למיליון אסימונים, והסקת R1 עולה ארבעה דולרים.

נ.ב: אבל אני עדיין רוצה להודות ל-DeepSeek על הוזלת המחיר. מי שיכול להוריד את המחיר הוא משפחה.

זה באמת זול מדי! בהשוואה לביצועים, אני חושב שמה שהתעלמו מהתאומים הוא המחיר!

ביצועי מקרה

מכיוון שהיא טוענת שהיא טובה כמו Deepseek, אנחנו בהחלט חייבים לראות איך היא באמת מתפקדת במקרים ולראות איך גולשים שונים בדקו אותה

משחק פינבול מבוסס פיזיקה

בואו נסתכל תחילה על המקרה הפופולרי הזה, שמשתמש במנוע פיזיקה כדי לדמות אפקטים ריאליסטיים כמו התנגשויות, חיכוך וכוח משיכה.

רמז: כתוב תוכנית Python המציגה כדור קופץ בתוך משושה מסתובב. הכדור צריך להיות מושפע מכוח הכבידה וחיכוך, ועליו לקפוץ באופן מציאותי מהקירות המסתובבים

כך מבצעים Deepseek R1 ו-o3-min:

הגרסה שנוצרה על ידי Gemini 2.0 Pro Experimental:

שני הדגמים הנותרים אינם מתפקדים היטב

קושי כפול! הפוך את הכדור לפצל ל-100 כדורים!

רמז: כתוב תסריט ל-100 כדורים מקפצים צהובים בהירים בתוך כדור, הקפד לטפל בצורה נכונה בזיהוי התנגשות. הפוך את הכדור להסתובב לאט. ודא שהכדורים יישארו בתוך הכדור. יישם ב-p5.js

כל הכבוד! הסיבוב האיטי של הכדור הוא חלק מאוד, והסימולציה של חוקים פיזיקליים מצוינת. גם 100 הכדורים מתנגשים בהתמדה ו"עושים את עבודתם" ~

כתוב סקריפט p5.js כדי לדמות 25 חלקיקים מקפצים בחלל ואקום בתוך מיכל גלילי. השתמש בצבע אחר עבור כל כדור וודא שהם משאירים שובל כדי להראות את התנועה שלהם. הוסף סיבוב איטי של המיכל כדי לראות טוב יותר את המתרחש בסצנה. הקפד ליצור כללי זיהוי התנגשות ופיזיקה מתאימים כדי להבטיח שהחלקיקים יישארו בתוך המיכל. הוסף מיכל כדורי חיצוני. הוסף אפקט הגדלה והקטנה איטי לכל הסצנה.

שאלת מבחן תות שאי אפשר לעקוף

וגולשים חכמים (ערמומיים) זרקו שוב את מבחן התות הקלאסי:

כמה r's יש בתות

ו-Gemini 2.0 Flash Thinking Experimental קיבל את התשובה הנכונה:

הבוס של גוגל ג'ף דין בדק באופן אישי את כישורי התכנות שלו

ג'ף דין, מדען ראשי ב-Google DeepMind ו-Google Research, בדק גם את כישורי התכנות של גל של Gemini 2.0 Pro:

הוא נתן למודל להשלים את משחק בוגל הקלאסי, והקוד שנוצר בפעם הראשונה השלים את מציאת כל המילים התקפות ב- "ריבוע אותיות" מִשְׂחָק:

יתרה מכך, ג'ף דין אמר שהקוד הושלם תוך 18.9 שניות בלבד, וזה מהיר מאוד.

מנכ"ל Google DeepMind מלא אמון בעדכון הגדול הזה למודל, ואומר שהמהדורה הזו מניחה את הבסיס לגוגל להשיג עבודה עתידית עתידית של סוכנים חכמה:

מנכ"ל גוגל, סונדאר פיצ'אי, הבהיר בעבר כי 2025 תהיה תקופה קריטית עבור גוגל להאצת הפיתוח בתחום הבינה המלאכותית. זה מרגיש כמו לאחר פרסום זה, המסלול של גוגל ברור יותר!

בהשוואה למסלולים של ענקיות אחרות, מסלול ה-AI של גוגל מתמקד יותר בפרקטיות ומספק ישירות אפשרויות גרסה מרובות, בדיוק כמו ארגז כלים בינה מלאכותית, שבו אתה יכול לבחור ולבחור כרצונך, בהתאם לצרכים שלך, גמיש ונוח, ומסוגל לענות על כל מיני צרכים.

Gemini 2.0 שולט בטבלאות, בעוד DeepSeek V3 בוכה במחיר שלו, ואלוף חדש וחסכוני נולד!