দ গুগল জেমিনি ২.০ পরিবার অবশেষে সম্পূর্ণ হল! মুক্তি পাওয়ার সাথে সাথেই এটি চার্টে আধিপত্য বিস্তার করে।
ধাওয়া এবং অবরোধের মধ্যে গভীর অনুসন্ধান, Qwen এবং o3, গুগল আজ সকালে একসাথে তিনটি মডেল প্রকাশ করেছে: Gemini 2.0 Pro, Gemini 2.0 Flash এবং Gemini 2.0 Flash-Lite।

বৃহৎ মডেল LMSYS র্যাঙ্কিংয়ে, Gemini 2.0-Pro শীর্ষে উঠে এসেছে, এবং Gemini-2.0 পরিবারটি শীর্ষ ১০-এ উন্নীত হয়েছে।

প্রথমে মডেলের পারফরম্যান্স দেখে নেওয়া যাক
দ জেমিনি ২.০ মডেল এবার মুক্তিপ্রাপ্ত সকলেরই পারফরম্যান্সের দিক থেকে নিজস্ব হাইলাইট রয়েছে!

জেমিনি ২.০ প্রো (পরীক্ষামূলক)
হিসাবে ফ্ল্যাগশিপ মডেল জেমিনি সিরিজের, প্রো সংস্করণটি গুগলের সবচেয়ে উন্নত এআই ক্ষমতার প্রতিনিধিত্ব করে এবং কোডিং এবং অনুমান বিশেষ করে:
- অতিরিক্ত-বড় প্রসঙ্গ উইন্ডো: পর্যন্ত প্রসঙ্গ প্রক্রিয়াকরণ সমর্থন করে ২০ লক্ষ টোকেন
- শক্তিশালী টুল ইন্টিগ্রেশন: গুগল সার্চ এবং কোড এক্সিকিউশনকে গভীরভাবে একীভূত করে
- উপস্থিতি: গুগল এআই স্টুডিও, ভার্টেক্স এআই এবং জেমিনি অ্যাডভান্সড প্ল্যাটফর্মে পরীক্ষামূলক সংস্করণ হিসেবে ইতিমধ্যেই উপলব্ধ

জেমিনি ২.০ ফ্ল্যাশ
একটি হিসাবে অবস্থিত "অত্যন্ত দক্ষ কর্মী"। এটি গতি এবং কর্মক্ষমতা ভারসাম্যের উপর জোর দিয়ে ডিজাইন করা হয়েছে, এবং কম-বিলম্বিত প্রতিক্রিয়ার প্রয়োজন এমন অ্যাপ্লিকেশন পরিস্থিতির জন্য আদর্শ সহায়তা প্রদানের উদ্দেশ্যে তৈরি করা হয়েছে:
- লক্ষ লক্ষ প্রসঙ্গ উইন্ডো: ১০ লক্ষ টোকেন প্রসঙ্গ সমর্থন করে
- চমৎকার মাল্টিমোডাল ইনফারেন্স ক্ষমতা: মাল্টিমোডাল ডেটা প্রক্রিয়াকরণে দক্ষ, বর্তমানে মাল্টিমোডাল ইনপুট এবং সিঙ্গেল-মোডাল টেক্সট ইনপুট সমর্থন করে।
- ভবিষ্যতের বৈশিষ্ট্য সম্প্রসারণ: ছবি তৈরি এবং টেক্সট-টু-স্পিচ ফাংশন শীঘ্রই উপলব্ধ হবে।
- উপস্থিতি: আনুষ্ঠানিকভাবে ভার্টেক্স এআই স্টুডিও এবং গুগল এআই স্টুডিও প্ল্যাটফর্মে প্রকাশিত হয়েছে এবং জেমিনি এপিআই এর মাধ্যমে অ্যাক্সেস করা যেতে পারে।
জেমিনি ২.০ ফ্ল্যাশ-লাইট (প্রিভিউ)
"সবচেয়ে সাশ্রয়ী" মডেল হিসেবে, ফ্ল্যাশ-লাইট গতি, খরচ এবং কর্মক্ষমতার মধ্যে সর্বোত্তম ভারসাম্য প্রদান করে।
- সাশ্রয়ী সুবিধা: ১.৫ ফ্ল্যাশের মতো একই গতি এবং খরচ বজায় রেখে, এটি বেশিরভাগ বেঞ্চমার্ক পরীক্ষায় ১.৫ ফ্ল্যাশকে ছাড়িয়ে যায়।
- মিলিয়ন-স্তরের প্রসঙ্গ উইন্ডো: এছাড়াও ১ মিলিয়ন টোকেন কনটেক্সট প্রসেসিং পাওয়ার সমর্থন করে।
গুগল কর্তৃক প্রকাশিত পারফরম্যান্স মূল্যায়ন তুলনা অনুসারে, জেমিনি ২.০ প্রো এক্সপেরিমেন্টাল সংস্করণটি প্রায় সকল বেঞ্চমার্ক পরীক্ষায় সর্বোচ্চ স্কোর অর্জন করেছে, চমৎকার পারফর্ম করেছে:

এটি কোড জেনারেশন টাস্ক (যেমন LiveCodeBench v5) এবং জটিল গাণিতিক সমস্যা (যেমন বীজগণিত, জ্যামিতি এবং ক্যালকুলাস) তে বিশেষভাবে ভালো পারফর্ম করেছে। এছাড়াও, জটিল দীর্ঘ নথি বোঝার পরীক্ষায় উল্লেখযোগ্য উন্নতি হয়েছে।
এবং মূল্য নির্ধারণ
এপিআই খরচ-কার্যকারিতার দিক থেকেও গুগল একটি বিবেকবান প্রস্তুতকারক।

জেমিনি ২.০ ফ্ল্যাশের মিলিয়ন টোকেনের দাম এক ডলারেরও কম... এটি একাধিক মোড, নেটওয়ার্ক অনুসন্ধান এবং একটি অভূতপূর্ব প্রসঙ্গ উইন্ডো সমর্থন করে।
বিপরীতে, বর্তমানে Deepseek V3 এর দাম দশ লক্ষ টোকেনের জন্য এক ডলার, এবং R1 ইনফারেন্সের দাম চার ডলার।

দ্রষ্টব্য: কিন্তু দাম কমানোর জন্য আমি DeepSeek কে ধন্যবাদ জানাতে চাই। যারা দাম কমাতে পারেন তারা পরিবারের সদস্য।
এটা সত্যিই খুব সস্তা! পারফরম্যান্সের তুলনায়, আমার মনে হয় জেমিনি যে জিনিসটিকে উপেক্ষা করা হয়েছে তা হল দাম!
কেস পারফর্মেন্স
যেহেতু এটি ডিপসিকের মতোই ভালো বলে দাবি করে, তাই আমাদের অবশ্যই দেখতে হবে যে এটি আসলে কেসগুলিতে কেমন কাজ করে এবং বিভিন্ন নেটিজেনরা এটি কীভাবে পরীক্ষা করেছে।
একটি পদার্থবিদ্যা-ভিত্তিক পিনবল খেলা
প্রথমে এই জনপ্রিয় কেসটি দেখে নেওয়া যাক, যেখানে সংঘর্ষ, ঘর্ষণ এবং মাধ্যাকর্ষণের মতো বাস্তবসম্মত প্রভাব অনুকরণ করার জন্য একটি পদার্থবিদ্যা ইঞ্জিন ব্যবহার করা হয়।
ইঙ্গিত: একটি পাইথন প্রোগ্রাম লিখুন যা একটি ঘূর্ণায়মান ষড়ভুজের ভিতরে লাফিয়ে
ডিপসিক R1 এবং o3-মিনিট এইভাবে কাজ করে:

জেমিনি ২.০ প্রো এক্সপেরিমেন্টাল দ্বারা তৈরি সংস্করণ:

বাকি দুটি মডেল ভালো পারফর্ম করে না।
দ্বিগুণ কষ্ট! বলটিকে ১০০ বলে ভাগ করুন!
ইঙ্গিত: একটি গোলকের ভেতরে ১০০টি উজ্জ্বল হলুদ বলের জন্য একটি স্ক্রিপ্ট লিখুন, যাতে সংঘর্ষ সনাক্তকরণ সঠিকভাবে পরিচালনা করা যায়। গোলকটিকে ধীরে ধীরে ঘোরান। নিশ্চিত করুন যে বলগুলি গোলকের ভেতরে থাকে। p5.js-এ প্রয়োগ করুন।

দারুন! গোলকের ধীর ঘূর্ণন খুবই মসৃণ, এবং ভৌত নিয়মের অনুকরণ চমৎকার। ১০০টি বলও স্থিরভাবে সংঘর্ষ করছে এবং "তাদের কাজ করছে" ~
একটি নলাকার পাত্রের ভেতরে ভ্যাকুয়াম স্পেসে ২৫টি কণা লাফিয়ে

স্ট্রবেরি পরীক্ষার একটি প্রশ্ন যা এড়িয়ে যাওয়া যাবে না
আর চালাক (ধূর্ত) নেটিজেনরা আবারও ক্লাসিক স্ট্রবেরি টেস্টটি উড়িয়ে দিয়েছে:
স্ট্রবেরিতে কতটি আর আছে?

এবং জেমিনি ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল সঠিক উত্তর দিয়েছে:

গুগল বস জেফ ডিন ব্যক্তিগতভাবে তার প্রোগ্রামিং দক্ষতা পরীক্ষা করেছিলেন
গুগল ডিপমাইন্ড এবং গুগল রিসার্চের প্রধান বিজ্ঞানী জেফ ডিনও জেমিনি ২.০ প্রো-এর একটি তরঙ্গের প্রোগ্রামিং দক্ষতা পরীক্ষা করেছেন:

তিনি মডেলটিকে ক্লাসিক বোগল গেমটি সম্পূর্ণ করতে বলেছিলেন, এবং কোডটি প্রথমবারের মতো সমস্ত বৈধ শব্দ খুঁজে বের করার মাধ্যমে তৈরি হয়েছিল "অক্ষর বর্গক্ষেত্র" খেলা:

তাছাড়া, জেফ ডিন বলেছেন যে কোডটি মাত্র ১৮.৯ সেকেন্ডে সম্পন্ন হয়েছে, যা খুব দ্রুত।

গুগল ডিপমাইন্ডের সিইও মডেলের এই গুরুত্বপূর্ণ আপডেটের প্রতি পূর্ণ আত্মবিশ্বাসী, তিনি বলেন যে এই রিলিজটি গুগলের ভবিষ্যতের বুদ্ধিমান এজেন্টের কাজ অর্জনের ভিত্তি স্থাপন করবে:

গুগলের সিইও সুন্দর পিচাই আগেই স্পষ্ট করে বলেছেন যে ২০২৫ সাল হবে গুগলের জন্য কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে উন্নয়ন ত্বরান্বিত করার জন্য একটি গুরুত্বপূর্ণ সময়। মনে হচ্ছে এই প্রকাশের পর, গুগলের পথ আরও স্পষ্ট!
অন্যান্য জায়ান্টদের রুটের তুলনায়, গুগলের এআই রুট ব্যবহারিকতার উপর বেশি মনোযোগ দেয় এবং সরাসরি একাধিক সংস্করণের বিকল্প প্রদান করে, ঠিক যেমন একটি AI টুলবক্স, যেখানে আপনি আপনার পছন্দ অনুসারে, নমনীয় এবং সুবিধাজনকভাবে বেছে নিতে পারেন।, এবং সকল ধরণের চাহিদা পূরণ করতে সক্ষম।