إن جوجل جيميني 2.0 اكتملت العائلة أخيرًا! فهي تهيمن على المخططات بمجرد إصدارها.
في خضم الملاحقة والحصار ديبسيكأطلقت شركة جوجل اليوم في وقت مبكر من صباح اليوم، ثلاثة نماذج جديدة من هواتفها الذكية Qwen وo3، وهي: Gemini 2.0 Pro، وGemini 2.0 Flash، وGemini 2.0 Flash-Lite.

في تصنيفات LMSYS للنماذج الكبيرة، صعد Gemini 2.0-Pro إلى القمة، وتقدمت عائلة Gemini-2.0 بأكملها إلى المراكز العشرة الأولى.

دعونا نلقي نظرة أولاً على أداء النموذج
إن موديلات جيميني 2.0 تم إصدارها هذه المرة، وكلها لها مميزاتها الخاصة من حيث الأداء!

Gemini 2.0 Pro (تجريبي)
كما هو الحال نموذج رائد من سلسلة Gemini، يمثل الإصدار Pro قدرات الذكاء الاصطناعي الأكثر تقدمًا من Google، ويتفوق في الترميز والاستدلال بخاصة:
- نافذة سياقية كبيرة جدًا: يدعم معالجة السياق لما يصل إلى 2 مليون رمز
- تكامل الأدوات القوية: يدمج بشكل عميق بين بحث Google وتنفيذ التعليمات البرمجية
- التوفر: متوفر بالفعل كإصدار تجريبي على Google AI Studio وVertex AI ومنصة Gemini Advanced

جيميني 2.0 فلاش
يتم وضعه كـ "حصان عمل عالي الكفاءة"تم تصميمه مع التركيز على تحقيق التوازن بين السرعة والأداء، ويهدف إلى توفير الدعم المثالي لسيناريوهات التطبيق التي تتطلب استجابات ذات زمن انتقال منخفض:
- ملايين من نوافذ السياق: يدعم سياق 1 مليون رمز
- قدرات استدلال متعددة الوسائط ممتازة: جيد في معالجة البيانات متعددة الوسائط، ويدعم حاليًا الإدخال متعدد الوسائط وإدخال النص أحادي النمط
- توسيع الميزات المستقبلية: ستتوفر قريبًا وظيفتا إنشاء الصور وتحويل النص إلى كلام
- التوفر: تم إصداره رسميًا على منصات Vertex AI Studio وGoogle AI Studio، ويمكن الوصول إليه عبر واجهة برمجة التطبيقات Gemini.
Gemini 2.0 Flash-Lite (معاينة)
باعتباره النموذج "الأكثر فعالية من حيث التكلفة"، يوفر Flash-Lite أفضل توازن بين السرعة والتكلفة والأداء.
- مزايا فعالة من حيث التكلفة: مع الحفاظ على نفس السرعة والتكلفة مثل 1.5 Flash، فإنه يتفوق على 1.5 Flash في معظم اختبارات المقارنة.
- نافذة سياق المليون مستوى: يدعم أيضًا 1 مليون رمز من قوة معالجة السياق.
وفقًا لمقارنة تقييم الأداء التي أصدرتها Google، حققت النسخة التجريبية من Gemini 2.0 Pro أعلى الدرجات في جميع اختبارات القياس تقريبًا، وأداءً ممتازًا:

وقد حقق أداءً جيدًا بشكل خاص في مهام إنشاء التعليمات البرمجية (مثل LiveCodeBench v5) والمشكلات الرياضية المعقدة (مثل الجبر والهندسة وحساب التفاضل والتكامل). بالإضافة إلى ذلك، كان هناك تحسن كبير في اختبار فهم المستندات الطويلة المعقدة.
والتسعير
تعد Google أيضًا شركة مصنعة واعية من حيث فعالية تكلفة واجهة برمجة التطبيقات (API).

تبلغ تكلفة المليون رمز المميزة لبرنامج Gemini 2.0 Flash أقل من دولار واحد... وهو يدعم أوضاعًا متعددة، وعمليات بحث متصلة بالشبكة، ونافذة سياق غير مسبوقة.
في المقابل، تبلغ تكلفة Deepseek V3 حاليًا دولارًا واحدًا مقابل مليون رمز، وتبلغ تكلفة استدلال R1 أربعة دولارات.

ملاحظة: ولكنني أود أن أشكر DeepSeek على خفض السعر. أي شخص يستطيع خفض السعر هو فرد من العائلة.
هذا رخيص جدًا حقًا! مقارنة بالأداء، أعتقد أن ما تم تجاهله في Gemini هو السعر!
أداء الحالة
نظرًا لأنه يدعي أنه جيد مثل Deepseek، فيجب علينا بالتأكيد أن نرى كيف يعمل بالفعل في الحالات ونرى كيف اختبره مستخدمو الإنترنت المختلفون
لعبة البينبول تعتمد على الفيزياء
دعونا أولاً نلقي نظرة على هذه الحالة الشائعة، والتي تستخدم محركًا فيزيائيًا لمحاكاة التأثيرات الواقعية مثل الاصطدامات والاحتكاك والجاذبية.
تلميح: اكتب برنامج بايثون يعرض كرة ترتد داخل مسدس دوار. يجب أن تتأثر الكرة بالجاذبية والاحتكاك، ويجب أن ترتد بشكل واقعي عن الجدران الدوارة
هكذا يعمل Deepseek R1 و o3-min:

الإصدار الذي تم إنشاؤه بواسطة Gemini 2.0 Pro Experimental:

النموذجان المتبقيان لا يعملان بشكل جيد
ضاعف الصعوبة! قم بتقسيم الكرة إلى 100 كرة!
تلميح: اكتب نصًا برمجيًا لـ 100 كرة صفراء ساطعة مرتدة داخل كرة، مع التأكد من التعامل مع اكتشاف الاصطدام بشكل صحيح. اجعل الكرة تدور ببطء. تأكد من بقاء الكرات داخل الكرة. قم بالتنفيذ في p5.js

أحسنت! الدوران البطيء للكرة سلس للغاية، ومحاكاة القوانين الفيزيائية ممتازة. كما تصطدم الكرات المائة بشكل ثابت و"تؤدي وظيفتها" ~
اكتب نصًا برمجيًا بصيغة p5.js لمحاكاة 25 جسيمًا ترتد في فراغ داخل حاوية أسطوانية. استخدم لونًا مختلفًا لكل كرة وتأكد من تركها أثرًا لإظهار حركتها. أضف دورانًا بطيئًا للحاوية لمراقبة ما يحدث في المشهد بشكل أفضل. تأكد من إنشاء قواعد اكتشاف الاصطدام والفيزياء المناسبة لضمان بقاء الجسيمات داخل الحاوية. أضف حاوية كروية خارجية. أضف تأثير تكبير وتصغير بطيئًا للمشهد بأكمله.

سؤال اختبار الفراولة الذي لا يمكن تجاوزه
وقد ألقى مستخدمو الإنترنت الأذكياء (الماكرون) اختبار الفراولة الكلاسيكي مرة أخرى:
كم عدد الـ r في كلمة الفراولة؟

وقد توصل برنامج Gemini 2.0 Flash Thinking Experimental إلى الإجابة الصحيحة:

قام رئيس شركة جوجل جيف دين باختبار مهاراته في البرمجة شخصيًا
كما قام جيف دين، كبير العلماء في Google DeepMind وGoogle Research، باختبار مهارات البرمجة لموجة من Gemini 2.0 Pro:

لقد جعل النموذج يكمل لعبة Boggle الكلاسيكية، وتم إنشاء الكود في المرة الأولى التي تم فيها العثور على جميع الكلمات الصالحة في "مربع الحروف" لعبة:

علاوة على ذلك، قال جيف دين أن الكود اكتمل في 18.9 ثانية فقط، وهو سريع جدًا.

أعرب الرئيس التنفيذي لشركة Google DeepMind عن ثقته الكاملة في هذا التحديث الرئيسي للنموذج، قائلاً إن هذا الإصدار يضع الأساس لـ Google لتحقيق عمل الوكيل الذكي في المستقبل:

أوضح الرئيس التنفيذي لشركة جوجل، سوندار بيتشاي، في وقت سابق أن عام 2025 سيكون فترة حرجة بالنسبة لشركة جوجل لتسريع التطوير في مجال الذكاء الاصطناعي. يبدو الأمر كما لو أن بعد هذا الإصدار، أصبح طريق Google أكثر وضوحًا!
مقارنة بطرق عمالقة آخرين، فإن طريق الذكاء الاصطناعي الخاص بشركة جوجل يركز بشكل أكبر على التطبيق العملي ويوفر بشكل مباشر خيارات إصدار متعددة، تماما مثل صندوق أدوات الذكاء الاصطناعي، حيث يمكنك الاختيار كما تريد، وفقًا لاحتياجاتك، مرن ومريح، وقادرة على تلبية كافة أنواع الاحتياجات.