গুগল একসাথে তিনটি নতুন মডেল প্রকাশ করেছে: জেমিনি-২.০-প্রো বিনামূল্যে, অসাধারণ স্কোর রয়েছে এবং প্রথম স্থানে রয়েছে, এবং জটিল প্রম্পট কোডিং এবং প্রক্রিয়াকরণের জন্য উপযুক্ত!

গল্পটি জেমি n i 2.0 সম্পর্কে ত্বরান্বিত হচ্ছে।

ডিসেম্বরে ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল সংস্করণটি ডেভেলপারদের জন্য কম ল্যাটেন্সি এবং উচ্চ কর্মক্ষমতা সহ একটি কার্যকরী মডেল নিয়ে এসেছে।

এই বছরের শুরুর দিকে, গুগল এআই স্টুডিওতে 2.0 ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল আপডেট করা হয়েছিল যাতে ফ্ল্যাশের গতি এবং উন্নত অনুমান ক্ষমতা একত্রিত করে কর্মক্ষমতা আরও উন্নত করা যায়।

গত সপ্তাহে, আপডেটেড ভার্সন ২.০ ফ্ল্যাশ সম্পূর্ণরূপে জেমিনি ডেস্কটপ এবং মোবাইল অ্যাপে চালু করা হয়েছে।

আজ, একই সাথে তিনটি নতুন সদস্য উন্মোচিত হয়েছে: জেমিনি ২.০ প্রো-এর পরীক্ষামূলক সংস্করণ, যা এখন পর্যন্ত কোডিং এবং জটিল প্রম্পটে সেরা পারফর্ম করেছে, সাশ্রয়ী মূল্যের ২.০ ফ্ল্যাশ-লাইট, এবং চিন্তাভাবনা-বর্ধিত সংস্করণ ২.০ ফ্ল্যাশ থিংকিং।

সকল বিভাগে জেমিনি ২.০ প্রো প্রথম স্থানে রয়েছে। কোডিং, গণিত এবং ধাঁধায় জেমিনি-২.০-ফ্ল্যাশ শীর্ষ তিনে রয়েছে। সকল বিভাগে ফ্ল্যাশ-লাইট শীর্ষ দশে রয়েছে।

তিনটি মডেলের দক্ষতার তুলনামূলক তালিকা:

সমস্ত মডেল মাল্টিমোডাল ইনপুট এবং আউটপুট টেক্সট সমর্থন করে।

আরও মডেল দক্ষতা আসার পথে। কোডিং এরিনায় মডেল শক্তি চার্ট

উইন রেট হিট ম্যাপ

গুগল ওপেনএআই প্লাস ব্যবহারকারীদের তুলনায় ফ্রি ব্যবহারকারীদের ভালো ব্যবহার করে। এআই স্টুডিওতে জেমিনি ২.০ প্রো এক্সপেরিমেন্টালের বিনামূল্যে অ্যাক্সেস:

খেলতে ক্লিক করুন

ডিপসিক পরিষেবা সর্বদা একটি ত্রুটি অপেক্ষা প্রদর্শন করে... মনে রাখবেন যে প্রথম ইনফারেন্স-মুক্ত মডেলটিও ছিল 2.0 ফ্ল্যাশ থিংকিং, যা গুগল আইস্টুডিওতে ব্যবহৃত হয়েছিল।

এছাড়াও, আছে জেমিনির ওয়েব সংস্করণ:

একটি সংযুক্ত অনুমান মডেলও রয়েছে (তাহলে এটি আলাদা করার কারণ কী...)

গুগল জেমিনি ২.০ প্রো-এর পরীক্ষামূলক সংস্করণ প্রকাশ করেছে, এবং অফিসিয়াল বেঞ্চমার্ক পরীক্ষায় উন্নতি বেশ আকর্ষণীয়।

এটিতে সবচেয়ে শক্তিশালী কোডিং ক্ষমতা এবং জটিল প্রম্পট প্রক্রিয়া করার ক্ষমতা রয়েছে, এবং গুগলের দ্বারা প্রকাশিত যেকোনো মডেলের তুলনায় বিশ্ব জ্ঞান সম্পর্কে বোঝার এবং যুক্তি করার ক্ষমতা বেশি।

এটির সবচেয়ে বড় কনটেক্সট উইন্ডো রয়েছে (২০০ কিলোবাইট, এবং আমার দীর্ঘ কনটেক্সট হল জেমিনি মডেলের তুলনামূলকভাবে একটি বড় সুবিধা), যা এটিকে প্রচুর পরিমাণে তথ্য ব্যাপকভাবে বিশ্লেষণ এবং বুঝতে এবং গুগল অনুসন্ধান এবং কোড সম্পাদনের মতো সরঞ্জামগুলিকে কল করতে সক্ষম করে।

MATH পরীক্ষায়, এটি 91.8% অর্জন করেছে, যা সংস্করণ 1.5 এর তুলনায় প্রায় 5 শতাংশ পয়েন্ট বেশি। GPQA যুক্তি ক্ষমতা 64.7% এ পৌঁছেছে, এবং SimpleQA বিশ্ব জ্ঞান পরীক্ষা এমনকি 44.3% এ পৌঁছেছে।

সবচেয়ে উল্লেখযোগ্য হল প্রোগ্রামিং ক্ষমতা। এটি LiveCodeBench পরীক্ষায় 36.0% অর্জন করেছে এবং Bird-SQL রূপান্তর নির্ভুলতা 59.3% ছাড়িয়ে গেছে। 2 মিলিয়ন টোকেনের অতি-বৃহৎ প্রসঙ্গ উইন্ডোর সাথে মিলিত হয়ে, এটি সবচেয়ে জটিল কোড বিশ্লেষণের কাজগুলি পরিচালনা করার জন্য যথেষ্ট।

তুমি কার্সারে এটি চেষ্টা করে দেখতে পারো।

বহুভাষিক বোঝার ক্ষমতাও চিত্তাকর্ষক, গ্লোবাল MMLU পরীক্ষার স্কোর 86.5%। চিত্র বোঝার ক্ষমতা MMMU হল 72.7%, এবং ভিডিও বিশ্লেষণ ক্ষমতা হল 71.9%।

জেমিনি ২.০ ফ্ল্যাশ-লাইট একটি আকর্ষণীয় ভারসাম্য।

এটি ১.৫ ফ্ল্যাশের গতি এবং খরচ বজায় রাখে, তবে আরও ভালো কর্মক্ষমতা নিয়ে আসে। ১ মিলিয়ন টোকেন সহ প্রসঙ্গ উইন্ডো এটিকে আরও তথ্য প্রক্রিয়া করার অনুমতি দেয়।

সবচেয়ে ব্যবহারিক বিষয় হলো এর মূল্য/কর্মক্ষমতা অনুপাত: ৪০,০০০ ছবির ক্যাপশন তৈরি করতে ১TP12T1 এর চেয়ে কম খরচ হয়। এটি এআইকে আরও সহজ করে তোলে।

ব্লগার শ্রীবাস্তব উল্লেখ করেছেন: জেমিনি ২.০ প্রো এনকোডিং পাগলাটে!

টিপস: সৌরজগতের সিমুলেশন তৈরি করতে Three.js ব্যবহার করুন। একটি টাইম স্কেল, একটি ফোকাস ড্রপ-ডাউন মেনু যোগ করুন, কক্ষপথ দেখান এবং লেবেল দেখান। সবকিছু একটি ফাইলে তৈরি করুন যাতে আমি এটি একটি অনলাইন এডিটরে পেস্ট করতে পারি এবং আউটপুট দেখতে পারি।

এছাড়াও, কিছু ব্যবহারকারী উল্লেখ করেছেন যে জেমিনি ২.০ ফ্ল্যাশ তার নিজস্ব একটি প্যারাডক্স পরীক্ষায় আরও ভালো ফলাফল দিয়েছে:

পরিশেষে, গুগল উল্লেখ করেছে যে জেমিনি ২.০ এর নিরাপত্তা, কেবল প্যাচ নয়, শুরু থেকেই ডিজাইনের মূল বিষয়।

মডেলটিকে আত্ম-সমালোচনামূলক হতে শিখতে দিন। মিথুন রাশিকে তার নিজস্ব উত্তর মূল্যায়ন করতে এবং আরও সঠিক প্রতিক্রিয়া প্রদান করতে রিইনফোর্সমেন্ট লার্নিং ব্যবহার করুন। এটি সংবেদনশীল বিষয়গুলি মোকাবেলা করার সময় এটিকে আরও শক্তিশালী করে তোলে।

স্বয়ংক্রিয় রেড টিম টেস্টিংটি আকর্ষণীয়। এটি বিশেষভাবে পরোক্ষ প্রম্পট শব্দের ইনজেকশন রোধ করার জন্য ডিজাইন করা হয়েছে, যা ডেটাতে ক্ষতিকারক কমান্ড লুকিয়ে রাখার জন্য AI-কে একটি ইমিউন সিস্টেম দিয়ে সজ্জিত করার মতো।

অশ্রেণীভুক্ত

ব্রেকিং নিউজ! DeepSeek গবেষক অনলাইনে প্রকাশ করেছেন: R1 প্রশিক্ষণে মাত্র দুই থেকে তিন সপ্তাহ সময় লেগেছে, এবং চীনা নববর্ষের ছুটির সময় R1 শূন্যের একটি শক্তিশালী বিবর্তন লক্ষ্য করা গেছে

দ্বারাzddeepseeker অক্টোবর 4, 2025অক্টোবর 4, 2025

ব্রেকিং নিউজ! DeepSeek গবেষক অনলাইনে প্রকাশ করেছেন: R1 প্রশিক্ষণে মাত্র দুই থেকে তিন সপ্তাহ সময় লেগেছে, এবং চীনা নববর্ষের ছুটির সময় R1 শূন্যের একটি শক্তিশালী বিবর্তন লক্ষ্য করা গেছে। এইমাত্র, আমরা লক্ষ্য করেছি যে DeepSeek গবেষক দয়া গুও DeepSeek R1 এবং কোম্পানির ভবিষ্যৎ পরিকল্পনা সম্পর্কে নেটিজেনদের প্রশ্নের উত্তর দিয়েছেন। আমরা কেবল বলতে পারি...

অশ্রেণীভুক্ত

DeepSeek তার সোর্স কোড প্রকাশ করেছে, FlashMLA এর বিস্তারিত ব্যাখ্যা

দ্বারাzddeepseeker অক্টোবর 24, 2025অক্টোবর 24, 2025

গত সপ্তাহে, DeepSeek ঘোষণা করেছে যে তারা আগামী সপ্তাহে পাঁচটি প্রকল্প ওপেন সোর্স করবে: নেটিজেনরা বলেছেন, "এবার, OpenAI সত্যিই এখানে।" ঠিক এখনই, প্রথম ওপেন সোর্স প্রকল্প এসেছে, যা অনুমান ত্বরণের সাথে সম্পর্কিত, FlashMLA: ওপেন সোর্স প্রকল্পের ঠিকানা: DeepSeek FlashMLA এটি দুই ঘন্টা ধরে ওপেন সোর্স হয়েছে, এবং Github ইতিমধ্যেই 2.7k+ তারকা পেয়েছে: The…

অশ্রেণীভুক্ত

এটি DeepSeek-R1-32B এর কাছাকাছি এবং Fei-Fei Li এর s1 কে চূর্ণ করে দেয়! UC Berkeley এবং অন্যান্য ওপেন সোর্স নতুন SOTA ইনফারেন্স মডেল

দ্বারাzddeepseeker অক্টোবর 14, 2025অক্টোবর 14, 2025

32B ইনফারেন্স মডেলটি মাত্র 1/8 ডেটা ব্যবহার করে এবং একই আকারের DeepSeek-R1 এর সাথে সংযুক্ত! এইমাত্র, স্ট্যানফোর্ড, ইউসি বার্কলে এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের মতো প্রতিষ্ঠানগুলি যৌথভাবে একটি SOTA-স্তরের ইনফারেন্স মডেল, OpenThinker-32B প্রকাশ করেছে এবং 114k পর্যন্ত প্রশিক্ষণ ডেটাও ওপেন-সোর্স করেছে। OpenThinker প্রকল্পের হোমপেজ: OpenThinker Hugging Face:…

অশ্রেণীভুক্ত

FlashMLA কী? AI ডিকোডিং কার্নেলের উপর এর প্রভাব সম্পর্কে একটি বিস্তৃত নির্দেশিকা

দ্বারাdeepseeker সম্পর্কে অক্টোবর 24, 2025অক্টোবর 24, 2025

FlashMLA দ্রুত কৃত্রিম বুদ্ধিমত্তার জগতে, বিশেষ করে বৃহৎ ভাষা মডেল (LLM) ক্ষেত্রে মনোযোগ আকর্ষণ করেছে। DeepSeek দ্বারা তৈরি এই উদ্ভাবনী টুলটি হপার জিপিইউ-এর জন্য ডিজাইন করা একটি অপ্টিমাইজড ডিকোডিং কার্নেল হিসেবে কাজ করে - উচ্চ-কার্যক্ষমতাসম্পন্ন চিপ যা সাধারণত AI গণনায় ব্যবহৃত হয়। FlashMLA পরিবর্তনশীল-দৈর্ঘ্যের ক্রমগুলির দক্ষ প্রক্রিয়াকরণের উপর দৃষ্টি নিবদ্ধ করে, যা এটিকে বিশেষভাবে উপযুক্ত করে তোলে...

অশ্রেণীভুক্ত

প্রথম লঞ্চ! SiliconFlow X Huawei ক্লাউড অ্যাসেন্ড ক্লাউডের উপর ভিত্তি করে যৌথভাবে DeepSeek R1 এবং V3 অনুমান পরিষেবা চালু করেছে!

দ্বারাzddeepseeker অক্টোবর 1, 2025অক্টোবর 1, 2025

DeepSeek-R1 এবং DeepSeek-V3 তাদের ওপেন সোর্স লঞ্চ হওয়ার পর থেকে বিশ্বব্যাপী আলোড়ন সৃষ্টি করেছে। তারা DeepSeek টিমের পক্ষ থেকে সমস্ত মানবতার জন্য একটি উপহার, এবং আমরা তাদের সাফল্যের জন্য আন্তরিকভাবে খুশি। সিলিকন মোবিলিটি এবং হুয়াওয়ে ক্লাউড টিমের কঠোর পরিশ্রমের পর, আজ আমরা চাইনিজ ব্যবহারকারীদের একটি চাইনিজ উপহার দিচ্ছি...

অশ্রেণীভুক্ত

Qwen2.5-max বনাম DeepSeek R1: মডেলগুলির একটি গভীর তুলনা: প্রয়োগের পরিস্থিতির একটি সম্পূর্ণ বিশ্লেষণ

দ্বারাzddeepseeker অক্টোবর 14, 2025অক্টোবর 14, 2025

ভূমিকা আজ, বৃহৎ ভাষা মডেল (LLM) একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। ২০২৫ সালের গোড়ার দিকে, AI-এর জন্য প্রতিযোগিতা তীব্র হওয়ার সাথে সাথে, Alibaba নতুন Qwen2.5-max AI মডেল চালু করে এবং চীনের Hangzhou-এর একটি কোম্পানি DeepSeek R1 মডেল চালু করে, যা LLM প্রযুক্তির শীর্ষস্থানকে প্রতিনিধিত্ব করে। Deepseek R1 হল একটি ওপেন সোর্স AI মডেল যা আকর্ষণ করেছে...

অনুরূপ পোস্ট

মন্তব্য করুন জবাব বাতিল