গল্পটি জেমিni 2.0 সম্পর্কে ত্বরান্বিত হচ্ছে।

ডিসেম্বরে ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল সংস্করণটি ডেভেলপারদের জন্য কম ল্যাটেন্সি এবং উচ্চ কর্মক্ষমতা সহ একটি কার্যকরী মডেল নিয়ে এসেছে।

এই বছরের শুরুর দিকে, গুগল এআই স্টুডিওতে 2.0 ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল আপডেট করা হয়েছিল যাতে ফ্ল্যাশের গতি এবং উন্নত অনুমান ক্ষমতা একত্রিত করে কর্মক্ষমতা আরও উন্নত করা যায়।

গত সপ্তাহে, আপডেটেড ভার্সন ২.০ ফ্ল্যাশ সম্পূর্ণরূপে জেমিনি ডেস্কটপ এবং মোবাইল অ্যাপে চালু করা হয়েছে।

আজ, একই সাথে তিনটি নতুন সদস্য উন্মোচিত হয়েছে: জেমিনি ২.০ প্রো-এর পরীক্ষামূলক সংস্করণ, যা এখন পর্যন্ত কোডিং এবং জটিল প্রম্পটে সেরা পারফর্ম করেছে, সাশ্রয়ী মূল্যের ২.০ ফ্ল্যাশ-লাইট, এবং চিন্তাভাবনা-বর্ধিত সংস্করণ ২.০ ফ্ল্যাশ থিংকিং।

সকল বিভাগে জেমিনি ২.০ প্রো প্রথম স্থানে রয়েছে। কোডিং, গণিত এবং ধাঁধায় জেমিনি-২.০-ফ্ল্যাশ শীর্ষ তিনে রয়েছে। সকল বিভাগে ফ্ল্যাশ-লাইট শীর্ষ দশে রয়েছে।

তিনটি মডেলের দক্ষতার তুলনামূলক তালিকা:

সমস্ত মডেল মাল্টিমোডাল ইনপুট এবং আউটপুট টেক্সট সমর্থন করে।

আরও মডেল দক্ষতা আসার পথে। কোডিং এরিনায় মডেল শক্তি চার্ট

উইন রেট হিট ম্যাপ

গুগল ওপেনএআই প্লাস ব্যবহারকারীদের তুলনায় ফ্রি ব্যবহারকারীদের ভালো ব্যবহার করে। এআই স্টুডিওতে জেমিনি ২.০ প্রো এক্সপেরিমেন্টালের বিনামূল্যে অ্যাক্সেস:

খেলতে ক্লিক করুন

ডিপসিক পরিষেবা সর্বদা একটি ত্রুটি অপেক্ষা প্রদর্শন করে... মনে রাখবেন যে প্রথম ইনফারেন্স-মুক্ত মডেলটিও ছিল 2.0 ফ্ল্যাশ থিংকিং, যা গুগল আইস্টুডিওতে ব্যবহৃত হয়েছিল।

এছাড়াও, আছে জেমিনির ওয়েব সংস্করণ:

একটি সংযুক্ত অনুমান মডেলও রয়েছে (তাহলে এটি আলাদা করার কারণ কী...)

গুগল জেমিনি ২.০ প্রো-এর পরীক্ষামূলক সংস্করণ প্রকাশ করেছে, এবং অফিসিয়াল বেঞ্চমার্ক পরীক্ষায় উন্নতি বেশ আকর্ষণীয়।

এটিতে সবচেয়ে শক্তিশালী কোডিং ক্ষমতা এবং জটিল প্রম্পট প্রক্রিয়া করার ক্ষমতা রয়েছে, এবং গুগলের দ্বারা প্রকাশিত যেকোনো মডেলের তুলনায় বিশ্ব জ্ঞান সম্পর্কে বোঝার এবং যুক্তি করার ক্ষমতা বেশি।

এটির সবচেয়ে বড় কনটেক্সট উইন্ডো রয়েছে (২০০ কিলোবাইট, এবং আমার দীর্ঘ কনটেক্সট হল জেমিনি মডেলের তুলনামূলকভাবে একটি বড় সুবিধা), যা এটিকে প্রচুর পরিমাণে তথ্য ব্যাপকভাবে বিশ্লেষণ এবং বুঝতে এবং গুগল অনুসন্ধান এবং কোড সম্পাদনের মতো সরঞ্জামগুলিকে কল করতে সক্ষম করে।

MATH পরীক্ষায়, এটি 91.8% অর্জন করেছে, যা সংস্করণ 1.5 এর তুলনায় প্রায় 5 শতাংশ পয়েন্ট বেশি। GPQA যুক্তি ক্ষমতা 64.7% এ পৌঁছেছে, এবং SimpleQA বিশ্ব জ্ঞান পরীক্ষা এমনকি 44.3% এ পৌঁছেছে।

সবচেয়ে উল্লেখযোগ্য হল প্রোগ্রামিং ক্ষমতা। এটি LiveCodeBench পরীক্ষায় 36.0% অর্জন করেছে এবং Bird-SQL রূপান্তর নির্ভুলতা 59.3% ছাড়িয়ে গেছে। 2 মিলিয়ন টোকেনের অতি-বৃহৎ প্রসঙ্গ উইন্ডোর সাথে মিলিত হয়ে, এটি সবচেয়ে জটিল কোড বিশ্লেষণের কাজগুলি পরিচালনা করার জন্য যথেষ্ট।

তুমি কার্সারে এটি চেষ্টা করে দেখতে পারো।

বহুভাষিক বোঝার ক্ষমতাও চিত্তাকর্ষক, গ্লোবাল MMLU পরীক্ষার স্কোর 86.5%। চিত্র বোঝার ক্ষমতা MMMU হল 72.7%, এবং ভিডিও বিশ্লেষণ ক্ষমতা হল 71.9%।

জেমিনি ২.০ ফ্ল্যাশ-লাইট একটি আকর্ষণীয় ভারসাম্য।

এটি ১.৫ ফ্ল্যাশের গতি এবং খরচ বজায় রাখে, তবে আরও ভালো কর্মক্ষমতা নিয়ে আসে। ১ মিলিয়ন টোকেন সহ প্রসঙ্গ উইন্ডো এটিকে আরও তথ্য প্রক্রিয়া করার অনুমতি দেয়।

সবচেয়ে ব্যবহারিক বিষয় হলো এর মূল্য/কর্মক্ষমতা অনুপাত: ৪০,০০০ ছবির ক্যাপশন তৈরি করতে ১TP12T1 এর চেয়ে কম খরচ হয়। এটি এআইকে আরও সহজ করে তোলে।

ব্লগার শ্রীবাস্তব উল্লেখ করেছেন: জেমিনি ২.০ প্রো এনকোডিং পাগলাটে!

টিপস: সৌরজগতের সিমুলেশন তৈরি করতে Three.js ব্যবহার করুন। একটি টাইম স্কেল, একটি ফোকাস ড্রপ-ডাউন মেনু যোগ করুন, কক্ষপথ দেখান এবং লেবেল দেখান। সবকিছু একটি ফাইলে তৈরি করুন যাতে আমি এটি একটি অনলাইন এডিটরে পেস্ট করতে পারি এবং আউটপুট দেখতে পারি।

এছাড়াও, কিছু ব্যবহারকারী উল্লেখ করেছেন যে জেমিনি ২.০ ফ্ল্যাশ তার নিজস্ব একটি প্যারাডক্স পরীক্ষায় আরও ভালো ফলাফল দিয়েছে:

পরিশেষে, গুগল উল্লেখ করেছে যে জেমিনি ২.০ এর নিরাপত্তা, কেবল প্যাচ নয়, শুরু থেকেই ডিজাইনের মূল বিষয়।

মডেলটিকে আত্ম-সমালোচনামূলক হতে শিখতে দিন। মিথুন রাশিকে তার নিজস্ব উত্তর মূল্যায়ন করতে এবং আরও সঠিক প্রতিক্রিয়া প্রদান করতে রিইনফোর্সমেন্ট লার্নিং ব্যবহার করুন। এটি সংবেদনশীল বিষয়গুলি মোকাবেলা করার সময় এটিকে আরও শক্তিশালী করে তোলে।

স্বয়ংক্রিয় রেড টিম টেস্টিংটি আকর্ষণীয়। এটি বিশেষভাবে পরোক্ষ প্রম্পট শব্দের ইনজেকশন রোধ করার জন্য ডিজাইন করা হয়েছে, যা ডেটাতে ক্ষতিকারক কমান্ড লুকিয়ে রাখার জন্য AI-কে একটি ইমিউন সিস্টেম দিয়ে সজ্জিত করার মতো।

অনুরূপ পোস্ট

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।