העלות הגבוהה של שימוש במודלים גדולים של בינה מלאכותית היא סיבה מרכזית לכך שהרבה יישומי בינה מלאכותית עדיין לא יושמו וקדמו. בחירה בביצועים קיצוניים פירושה עלויות עצומות של כוח מחשוב, מה שמוביל לעלויות שימוש גבוהות שמשתמשים רגילים לא יכולים לקבל.
התחרות על דגמי AI גדולים היא כמו מלחמה ללא עשן. לאחר ש-DeepSeek שחררה ופתחה בקוד את הדגם הגדול האחרון R1, OpenAI גם הוציאה את דגם ה-o3 האחרון שלה תחת לחץ. גם שחקן הדגמים הגדול גוגל נאלץ להצטרף לתחרות העזה על דגמים בעלות נמוכה.
המהלך החדש של גוגל: חברים חדשים בסדרת ג'מיני נחשפו
בשעות הבוקר המוקדמות של ה-6 בפברואר השיקה גוגל סדרה של גרסאות חדשות של דגם הג'מיני. ביניהם, הגרסה הניסיונית של Gemini 2.0 Pro וגרסת התצוגה המקדימה של Gemini 2.0 Flash - Lite משכו תשומת לב רבה, והגרסה האחרונה של Gemini 2.0 Flash שוחררה רשמית.
כגרסה חדשה, Google Gemini 2.0 ל-Flash – Lite יש מחיר אטרקטיבי מאוד של 0.3 דולר בלבד למיליון אסימונים, מה שהופך אותו לדגם המשתלם ביותר של גוגל עד כה.
לגרסה הניסיונית של Gemini 2.0 Pro, לעומת זאת, יש יכולות מולטי-מודאליות עוצמתיות שיכולות להמיר בין טקסט ואודיו ווידאו.
הגרסה הניסיונית של Gemini 2.0 Flash Thinking היא בחינם לשימוש ויש לה גם את היכולת לגשת, לחלץ ולסכם את התוכן של סרטוני YouTube.
לוגאן קילפטריק, ראש מוצרי Google AI Studio, הכריז בפלטפורמת X כי הדגמים הללו הם "הדגמים החזקים ביותר בהיסטוריה של גוגל" וזמינים לכל המפתחים.
הביצועים והתוצאות המרשימות של דגמי ה-Gemini החדשים בלוח המובילים
ב-Chatbot Arena Large Model Leaderboard, ה-Gemini 2.0 Flash Thinking Experimental Edition ו-Gemini 2.0 Pro Experimental Edition השיגו תוצאות יוצאות דופן. בהשוואה לדגמים הגדולים הקודמים של גוגל, Gemini 2.0 התקדמה מאוד, ובאופן לא מפתיע, הם הגיעו בהצלחה לראש טבלת המובילים, עם ציון משולב שעולה על ChatGPT-4o ו-DeepSeek-R1. זהו שיפור עצום.
תוצאה זו מבוססת על הערכה מקיפה של היכולות של מודלים גדולים בתחומים שונים, לרבות מתמטיקה, קידוד ועיבוד רב לשוני.
מחיר וביצועים: לכל גרסה של Gemini 2.0 יש יתרונות משלה
לגרסאות השונות של Gemini 2.0 יש מאפיינים משלהן מבחינת מחיר וביצועים. הושג איזון בין ביצועים למחיר, מה שנותן למשתמשים אפשרויות רבות יותר. ניתן לקרוא לממשקי ה-API של הגרסאות השונות של Gemini 2.0 דרך Google AI Studio ו-Vertex AI. מפתחים ומשתמשים יכולים לבחור את הגרסה המתאימה בהתאם לצרכיהם.
Gemini 2.0 עשתה התקדמות ופיתוח רב בהשוואה ל-Gemini 1.5. למרות שלגרסאות השונות של Gemini 2.0 יש הבדלים, כולן שופרו בסך הכל. באופן ספציפי, אתה צריך לקבוע את התרחיש שבו אתה משתמש, ואז אתה יכול לבחור טוב יותר את דגם הג'מיני שמתאים לך.
מבחינת מחיר, Gemini 2.0 Flash ו-Gemini 2.0 Flash – Lite מתמקדים בפריסה קלת משקל. הם תומכים בעד מיליון אסימונים באורך חלון ההקשר, ומבחינת תמחור, ההבחנה בין עיבוד טקסט ארוך וקצר ב-Gemini 1.5 Flash הוסרה, והמחיר מאוחד במחיר אסימון יחידה.
Gemini 2.0 Flash עולה 0.4 דולר למיליון אסימונים עבור פלט טקסט, שזה חצי מהמחיר של Gemini 1.5 Flash בעת עיבוד טקסטים ארוכים.
Gemini 2.0 Flash – Lite טובה אפילו יותר באופטימיזציית עלויות בתרחישי פלט טקסט בקנה מידה גדול, עם תמחור פלט טקסט של 0.3 דולר למיליון אסימונים. אפילו מנכ"ל גוגל, סונדאר פיצ'אי, שיבח את זה כ"יעיל וחזק".
במונחים של שיפור ביצועים, ל-Gemini 2.0 Flash יש פונקציות אינטראקציה מולטי-מודאלית מקיפות יותר מאשר לגרסת Lite. זה מתוכנן לתמוך בפלט תמונה, כמו גם בקלט ובפלט בזמן אמת דו-כיווני של אופנים כמו טקסט, אודיו ווידאו.
הגרסה הניסיונית של Gemini 2.0 Pro מצטיינת מבחינת ביצועי קידוד והנחיות מורכבות. חלון ההקשר שלו יכול להגיע עד 2 מיליון אסימונים, והיכולת הכללית שלו עלתה מ-75.8% ל-79.1% בהשוואה לדור הקודם, וזה הבדל משמעותי ביכולת הקידוד וההיגיון עם Gemini 2.0 Flash ו-Gemini 2.0 Flash – Lite.
צוות היישומים Gemini אמר בפלטפורמת X שמשתמשי Gemini Advanced יכולים לגשת לגרסה הניסיונית Gemini 2.0 Pro דרך התפריט הנפתח של הדגם, והגרסה הניסיונית Gemini 2.0 Flash Thinking חינמית למשתמשי יישומי Gemini, וניתן להשתמש בגרסה זו בשילוב עם YouTube, חיפוש Google ומפות Google.
התמודדות עם תחרות: תחרות עלות-תועלת של מודלים של גוגל
בתקופה שבה עלות פיתוח המודלים הפכה לנושא חם בתעשייה, ההשקה של הקוד הפתוח, בעלות נמוכה ובעל ביצועים גבוהים DeepSeek – R1, השפיעה על התעשייה כולה.
במהלך שיחת הוועידה לאחר פרסום הדו"ח הכספי של גוגל ברבעון הרביעי לשנת 2024, פיצ'אי, תוך הכרה בהישגים של DeepSeek, הדגיש גם כי סדרת הדגמים Gemini מובילה באיזון בין עלות, ביצועים והשהייה, וכי הביצועים הכוללים שלהם טובים יותר משל דגמי ה-V3 וה-R1 של DeepSeek.
מנקודת המבט של דירוג מבחן ביצועי המודל הגדול של LiveBench שנבנה על ידי Yang Likun וצוותו, הדירוג הכללי של Gemini 2.0 Flash גבוה יותר מזה של DeepSeek V3 ו-o1 – mini של OpenAI, אבל הוא נמצא מאחורי DeepSeek – R1 ו-o1 של OpenAI. עם זאת, ההשקה של Google של Gemini 2.0 Flash – Lite היא כמו קלף מנצח. גוגל מקווה להפוך את הדגמים הגדולים האחרונים לנגישים עבור יותר אנשים, להפחית את עלויות השימוש של המשתמשים, ומקווה לתפוס מקום בתחרות בין חברות על מחיר/ביצועים.
לאחר שגוגל פרסמה את ה העדכנית ביותר של Gemini 2.0, משתמש רשת החל לנסות ולנתח את Gemini 2.0 Flash ודגמי deepseek ו-openai GPT-4o פופולריים אחרים בעצמו. הוא גילה שהגרסה החדשה של Gemini 2.0 Flash עולה על שני הדגמים האחרים מבחינת ביצועים וגם מבחינת עלות. זה גם נותן לנו הצצה להתפתחות והאבולוציה של גוגל, וזו התחלה טובה.
באופן ספציפי, Gemini 2.0 Flash עולה 0.1 דולר למיליון אסימונים עבור קלט ו-0.4 דולר עבור פלט, שניהם נמוכים בהרבה מ-DeepSeek V3. זהו שיפור ופיתוח עצום. המשתמש ברשת ציין גם בפלטפורמת X: "הגרסה הרשמית של Gemini 2.0 Flash עולה שליש מ-GPT-4o-mini, בעוד שהיא מהירה פי שלושה."
טרנד חדש בשוק הדגמים הגדולים: התמורה לכסף היא המלך
כיום, תחום הדגמים הגדולים נקלע למלחמת מחירים חדשה. בעבר, העלות הגבוהה של שימוש בדגמים גדולים יצרה התנגדות מסוימת לשימוש ולקידום. השפעת מלחמת המחירים לדגמים גדולים שהופעלה על ידי DeepSeek על שוק הדגמים הגדולים בחו"ל עדיין ממשיכה לתסוס. במקביל, אפשרות הקוד הפתוח אפשרה ליותר משתמשים להבין ולהשתמש בתוצאות המחקר העדכניות ביותר של מודלים גדולים. אסטרטגיית הקוד הפתוח + המחיר הנמוך הפעילה לחץ גם על חברות דגמים גדולות אמריקאיות רבות.
גוגל השיקה את Gemini 2.0 Flash-Lite, ו-OpenAI הפכה את פונקציית החיפוש ChatGPT לזמינה באופן חופשי לכל המשתמשים, כך שמשתמשים יכולים להשתמש בפונקציית החיפוש כדי לבצע משימות מגוונות יותר. הצוות הפנימי של Meta מגביר גם את המחקר על אסטרטגיות הפחתת מחירים של דגמים גדולים תוך קידום פיתוח נוסף של מודלים גדולים בקוד פתוח של Meta.
בתחום התחרותי הזה, אף חברה לא יכולה לשבת בנוחות במקום הראשון. חברות מנסות למשוך ולשמור על משתמשים על ידי שיפור העלות-תועלת. מגמה זו תסייע לדגמים גדולים לעבור מפיתוח טכנולוגי טהור ליישום רחב יותר, ושוק הדגמים הגדולים העתידי ימשיך להתפתח ולשנות בתחרות על עלות-תועלת.