کی کہانی جیمیni 2.0 تیز ہو رہا ہے.

دسمبر میں فلیش تھنکنگ تجرباتی ورژن نے ڈویلپرز کو کم تاخیر اور اعلی کارکردگی کے ساتھ کام کرنے والا ماڈل لایا۔

اس سال کے شروع میں، Google AI اسٹوڈیو میں 2.0 Flash Thinking Experimental کو اپ ڈیٹ کیا گیا تھا تاکہ Flash کی رفتار کو بہتر اندازے کی صلاحیتوں کے ساتھ ملا کر کارکردگی کو مزید بہتر بنایا جا سکے۔

پچھلے ہفتے، اپ ڈیٹ شدہ ورژن 2.0 فلیش کو مکمل طور پر جیمنی ڈیسک ٹاپ اور موبائل ایپس پر لانچ کیا گیا تھا۔

آج، ایک ہی وقت میں تین نئے اراکین کی نقاب کشائی کی گئی ہے: Gemini 2.0 Pro کا تجرباتی ورژن، جس نے اب تک کوڈنگ اور پیچیدہ اشارے میں بہترین کارکردگی کا مظاہرہ کیا ہے، لاگت سے موثر 2.0 Flash-Lite، اور سوچ میں اضافہ شدہ ورژن 2.0 Flash Thinking۔

Gemini 2.0 Pro تمام زمروں میں پہلے نمبر پر ہے۔ Gemini-2.0-Flash کوڈنگ، ریاضی اور پہیلیاں میں سرفہرست تین میں ہے۔ فلیش لائٹ تمام زمروں میں ٹاپ ٹین میں ہے۔

تین ماڈلز کی صلاحیتوں کا موازنہ چارٹ:

تمام ماڈل ملٹی موڈل ان پٹ اور آؤٹ پٹ ٹیکسٹ کو سپورٹ کرتے ہیں۔

مزید موڈل صلاحیتیں راستے میں ہیں۔ کوڈنگ کے میدان میں ماڈل کی طاقت کا چارٹ

جیت کی شرح گرمی کا نقشہ

گوگل مفت صارفین کے ساتھ اوپن اے آئی پلس کے صارفین سے بہتر سلوک کرتا ہے۔ AI اسٹوڈیو میں Gemini 2.0 Pro تجرباتی تک مفت رسائی:

کھیلنے کے لیے کلک کریں۔

ڈیپ سیک سروس ہمیشہ انتظار میں ایرر دکھاتی ہے… یاد رہے کہ پہلا انفرنس فری ماڈل بھی 2.0 فلیش تھنکنگ تھا، جو گوگل aistudio میں استعمال ہوتا تھا۔

اس کے علاوہ، وہاں ہے جیمنی کا ویب ورژن:

یہاں ایک منسلک تخمینہ ماڈل بھی ہے (تو اسے الگ کیوں کریں…)

گوگل نے جیمنی 2.0 پرو کا تجرباتی ورژن جاری کیا، اور سرکاری بینچ مارک ٹیسٹوں میں بہتری کافی دلکش ہے۔

اس میں سب سے زیادہ طاقتور کوڈنگ کی صلاحیتیں ہیں اور پیچیدہ اشارے پر کارروائی کرنے کی صلاحیت ہے، اور اس میں گوگل کے اب تک جاری کردہ کسی بھی ماڈل کے مقابلے میں عالمی معلومات کو سمجھنے اور استدلال کرنے کی بہتر صلاحیت ہے۔

اس میں سیاق و سباق کی سب سے بڑی ونڈو ہے (200k، اور میرا طویل سیاق و سباق جیمنی ماڈل کا نسبتاً بڑا فائدہ ہے)، جو اسے معلومات کی ایک بڑی مقدار کا جامع تجزیہ کرنے اور سمجھنے، اور گوگل سرچ اور کوڈ پر عمل درآمد جیسے ٹولز کو کال کرنے کے قابل بناتا ہے۔

MATH ٹیسٹ میں، اس نے 91.8% حاصل کیا، جو کہ ورژن 1.5 کے مقابلے میں تقریباً 5 فیصد پوائنٹس کا اضافہ ہے۔ GPQA استدلال کی صلاحیت 64.7% تک پہنچ گئی، اور SimpleQA ورلڈ نالج ٹیسٹ یہاں تک کہ 44.3% تک پہنچ گیا۔

سب سے زیادہ قابل ذکر پروگرامنگ کی صلاحیت ہے۔ اس نے LiveCodeBench ٹیسٹ میں 36.0% حاصل کیا، اور Bird-SQL کی تبدیلی کی درستگی 59.3% سے تجاوز کر گئی۔ 2 ملین ٹوکنز کی انتہائی بڑی سیاق و سباق والی ونڈو کے ساتھ مل کر، یہ سب سے پیچیدہ کوڈ تجزیہ کاموں کو سنبھالنے کے لیے کافی ہے۔

آپ اسے کرسر میں آزما سکتے ہیں۔

86.5% کے گلوبل MMLU ٹیسٹ سکور کے ساتھ کثیر زبانوں کو سمجھنے کی صلاحیت بھی متاثر کن ہے۔ تصویری تفہیم MMMU 72.7% ہے، اور ویڈیو تجزیہ کرنے کی صلاحیت 71.9% ہے۔

جیمنی 2.0 فلیش لائٹ ایک دلچسپ توازن ہے۔

یہ 1.5 فلیش کی رفتار اور قیمت کو برقرار رکھتا ہے، لیکن بہتر کارکردگی لاتا ہے۔ 1 ملین ٹوکن کے ساتھ سیاق و سباق کی ونڈو اسے مزید معلومات پر کارروائی کرنے کی اجازت دیتی ہے۔

سب سے زیادہ عملی چیز اس کی قیمت/کارکردگی کا تناسب ہے: 40,000 تصاویر کے لیے کیپشن جنریشن کی قیمت $1 سے کم ہے۔ یہ AI کو مزید نیچے سے زمین بناتا ہے۔

بلاگر شریواستو نے ذکر کیا: جیمنی 2.0 پرو انکوڈنگ پاگل ہے!

ٹپ: شمسی نظام کا تخروپن بنانے کے لیے Three.js استعمال کریں۔ ٹائم اسکیل، فوکس ڈراپ ڈاؤن مینو شامل کریں، مدار دکھائیں اور لیبل دکھائیں۔ ہر چیز کو ایک فائل میں بنائیں تاکہ میں اسے آن لائن ایڈیٹر میں پیسٹ کر سکوں اور آؤٹ پٹ دیکھ سکوں۔

اس کے علاوہ، کچھ صارفین نے بتایا کہ جیمنی 2.0 فلیش نے اپنے ہی ایک پیراڈاکس ٹیسٹ میں بہتر نتائج پیش کیے:

آخر میں، گوگل نے ذکر کیا کہ جیمنی 2.0 کی سیکیورٹی، نہ صرف پیچ، شروع سے ہی ڈیزائن کے مرکز میں ہے۔

ماڈل کو خود تنقیدی بننا سیکھنے دیں۔ جیمنی کو اپنے جوابات کا جائزہ لینے اور زیادہ درست تاثرات فراہم کرنے کے لیے کمک سیکھنے کا استعمال کریں۔ یہ حساس موضوعات سے نمٹنے کے وقت اسے زیادہ مضبوط بناتا ہے۔

خودکار ریڈ ٹیم کی جانچ دلچسپ ہے۔ یہ خاص طور پر بالواسطہ فوری الفاظ کے انجیکشن کو روکنے کے لیے ڈیزائن کیا گیا ہے، جو کہ AI کو مدافعتی نظام سے لیس کرنے کے مترادف ہے تاکہ کسی کو ڈیٹا میں بدنیتی پر مبنی احکامات کو چھپانے سے روکا جا سکے۔

ملتے جلتے پوسٹس

جواب دیں

آپ کا ای میل ایڈریس شائع نہیں کیا جائے گا۔ ضروری خانوں کو * سے نشان زد کیا گیا ہے