AI সার্কেলে, DeepSeek R1 শারীরিক পরীক্ষায় o1 এবং Claude কে ক্রমাগত ছাড়িয়ে গেছে, এবং আমরা RL এর স্বর্ণযুগে প্রবেশ করেছি।

আমরা কেউই আশা করিনি যে AI ক্ষেত্রে 2025 এভাবেই শুরু হবে।

DeepSeek R1 সত্যিই আশ্চর্যজনক!

সম্প্রতি, "রহস্যময় ইস্টার্ন পাওয়ার" DeepSeek সিলিকন ভ্যালিকে "কঠোর নিয়ন্ত্রণ" করেছে।

আমি R1 কে পিথাগোরাসের উপপাদ্যটি বিস্তারিতভাবে ব্যাখ্যা করতে বলেছিলাম। AI এই সমস্ত কাজ 30 সেকেন্ডেরও কম সময়ে কোন ভুল ছাড়াই সম্পন্ন করেছে। সংক্ষেপে, এটি শেষ।

দেশী এবং বিদেশী AI সার্কেলে, সাধারণ নেটিজেনরা আশ্চর্যজনক এবং শক্তিশালী নতুন AI আবিষ্কার করেছে (যা ওপেন সোর্সও বটে), এবং একাডেমিক বিশেষজ্ঞরা চিৎকার করেছেন "আমাদের অবশ্যই ধরতে হবে"৷ এমনও শোনা যাচ্ছে যে বিদেশী AI কোম্পানিগুলি ইতিমধ্যেই একটি বড় হুমকির সম্মুখীন হচ্ছে।

শুধু এই সপ্তাহে মুক্তি পাওয়া এই DeepSeek R1 নিন। কোনো তত্ত্বাবধানে প্রশিক্ষণ ছাড়াই এর বিশুদ্ধ শক্তিবৃদ্ধি শেখার পথ চমকপ্রদ। গত বছরের ডিসেম্বরে Deepseek-v3 বেসের বিকাশ থেকে ওপেনএআই o1-এর সাথে তুলনীয় বর্তমান চিন্তা চেইন সক্ষমতা পর্যন্ত, এটি সময়ের ব্যাপার বলে মনে হচ্ছে।

কিন্তু যখন এআই সম্প্রদায় প্রযুক্তিগত প্রতিবেদনগুলি পড়তে এবং প্রকৃত পরিমাপের তুলনা করতে ব্যস্ত, তখনও মানুষের মনে R1 সম্পর্কে সন্দেহ রয়েছে: একগুচ্ছ বেঞ্চমার্ককে ছাড়িয়ে যেতে সক্ষম হওয়া ছাড়াও, এটি কি সত্যিই নেতৃত্ব দিতে পারে?

সূচিপত্র

এটি কি "ভৌত আইন" এর নিজস্ব সিমুলেশন তৈরি করতে পারে?

আপনি এটা বিশ্বাস করেন না? চলুন বড় মডেল একটি পিনবল সঙ্গে খেলা যাক?

সাম্প্রতিক দিনগুলিতে, এআই সম্প্রদায়ের কিছু লোক একটি পরীক্ষায় আচ্ছন্ন হয়ে পড়েছে - একটি সমস্যা সমাধানের জন্য বিভিন্ন এআই বড় মডেলগুলি (বিশেষ করে তথাকথিত যুক্তি মডেলগুলি) পরীক্ষা করে: “একটি নির্দিষ্ট ভিতরে হলুদ বল বাউন্স করতে একটি পাইথন স্ক্রিপ্ট লিখুন আকৃতি আকৃতিটি ধীরে ধীরে ঘোরান এবং নিশ্চিত করুন যে বলটি আকৃতির ভিতরে থাকে।"

কিছু মডেল এই "ঘূর্ণায়মান বল" বেঞ্চমার্কে অন্যদের ছাড়িয়ে যায়। CoreView CTO ইভান ফিওরাভান্তির মতে, DeepSeek, একটি গার্হস্থ্য কৃত্রিম বুদ্ধিমত্তা পরীক্ষাগার, একটি ওপেন সোর্স বড় মডেল R1 রয়েছে যা OpenAI-এর o1 প্রো মডেলকে ছাড়িয়ে যায়, যার দাম OpenAI-এর ChatGPT প্রো প্রোগ্রামের অংশ হিসাবে প্রতি মাসে $200।

বামদিকে OpenAI o1, এবং ডানদিকে DeepSeek R1। উপরে উল্লিখিত হিসাবে, এখানে প্রম্পটটি হল: “একটি বর্গক্ষেত্রের মধ্যে একটি বাউন্সিং হলুদ বলের জন্য একটি পাইথন স্ক্রিপ্ট লিখুন, সংঘর্ষ সনাক্তকরণ সঠিকভাবে পরিচালনা করা নিশ্চিত করুন৷ বর্গক্ষেত্রটিকে ধীরে ধীরে ঘোরান। এটি পাইথনে প্রয়োগ করুন। বল যেন স্কোয়ারের মধ্যে থাকে।"

X-এর অন্য ব্যবহারকারীর মতে, অ্যানথ্রপিক ক্লড 3.5 সনেট এবং গুগলের জেমিনি 1.5 প্রো মডেলগুলি ভৌত নীতিগুলি সম্পর্কে ভুল রায় দিয়েছে, যার ফলে বলটি তার আকৃতি থেকে বিচ্যুত হয়েছে। কিছু ব্যবহারকারী এও রিপোর্ট করেছেন যে Google এর সাম্প্রতিক জেমিনি 2.0 ফ্ল্যাশ থিঙ্কিং এক্সপেরিমেন্টাল, সেইসাথে তুলনামূলকভাবে পুরানো OpenAI GPT-4o, একবারে মূল্যায়ন পাস করেছে।

কিন্তু এখানে পার্থক্য বলার একটি উপায় আছে:

এই টুইটের অধীনে নেটিজেনরা বলেছেন: o1 এর ক্ষমতা মূলত খুব ভাল ছিল, কিন্তু OpenAI গতিকে অপ্টিমাইজ করার পরে এটি দুর্বল হয়ে পড়ে, এমনকি $200/মাস সদস্যপদ সংস্করণের সাথেও।

একটি বাউন্সিং বল অনুকরণ করা একটি ক্লাসিক প্রোগ্রামিং চ্যালেঞ্জ। নির্ভুল সিমুলেশন সংঘর্ষ সনাক্তকরণ অ্যালগরিদমগুলিকে একত্রিত করে, যা দুটি বস্তুর (যেমন একটি বল এবং একটি আকৃতির দিক) সংঘর্ষ হলে সনাক্ত করতে হবে। একটি ভুলভাবে লিখিত অ্যালগরিদম সিমুলেশনের কর্মক্ষমতা প্রভাবিত করতে পারে বা স্পষ্ট শারীরিক ত্রুটির কারণ হতে পারে।

এন৮ প্রোগ্রামস, এআই স্টার্টআপ নউস রিসার্চের একজন গবেষক বলেছেন, স্ক্র্যাচ থেকে ঘূর্ণায়মান হেপ্টাগনে বাউন্সিং বল লিখতে তার প্রায় দুই ঘণ্টা সময় লেগেছে। "একাধিক স্থানাঙ্ক সিস্টেমগুলিকে অবশ্যই ট্র্যাক করতে হবে, প্রতিটি সিস্টেমে সংঘর্ষগুলি কীভাবে পরিচালনা করা হয় তা বোঝার প্রয়োজন, এবং কোডটি অবশ্যই স্ক্র্যাচ থেকে শক্তিশালী হতে ডিজাইন করা উচিত।"

যদিও বাউন্সিং বল এবং স্পিনিং শেপ প্রোগ্রামিং দক্ষতার একটি যুক্তিসঙ্গত পরীক্ষা, তবুও এগুলি বড় মডেলের জন্য নতুন প্রজেক্ট, এমনকি প্রম্পটে ছোট পরিবর্তনও বিভিন্ন ফলাফল আনতে পারে। সুতরাং যদি এটি শেষ পর্যন্ত বড় AI মডেলগুলির জন্য বেঞ্চমার্ক পরীক্ষার অংশ হয়ে ওঠে, তবে এটি এখনও উন্নত করা দরকার।

যাই হোক না কেন, ব্যবহারিক পরীক্ষার এই তরঙ্গের পরে, আমরা বৃহৎ মডেলগুলির মধ্যে ক্ষমতার পার্থক্যের ধারনা পেয়েছি।

DeepSeek হল নতুন "সিলিকন ভ্যালি মিথ৷

DeepSeek প্যাসিফিক জুড়ে আতঙ্ক সৃষ্টি করছে।

মেটা কর্মীরা পোস্ট করেছেন যে "মেটা ইঞ্জিনিয়াররা উন্মত্তভাবে DeepSeek বিশ্লেষণ করছে যাতে তারা এটি থেকে যে কোনও কিছু অনুলিপি করার চেষ্টা করে।"

এআই প্রযুক্তি স্টার্টআপ স্কেল এআই-এর প্রতিষ্ঠাতা আলেকজান্ডার ওয়াংও প্রকাশ্যে বলেছেন যে DeepSeek-এর AI বড় মডেলের কার্যক্ষমতা মোটামুটি মার্কিন যুক্তরাষ্ট্রের সেরা মডেলের সমতুল্য।

তিনি আরও বিশ্বাস করেন যে মার্কিন যুক্তরাষ্ট্র গত এক দশকে এআই প্রতিযোগিতায় চীনের চেয়ে এগিয়ে থাকতে পারে, তবে DeepSeek এর AI বড় মডেলের প্রকাশ "সবকিছু পরিবর্তন করতে পারে।"

X ব্লগার @8teAPi বিশ্বাস করে যে DeepSeek একটি "সাইড প্রজেক্ট" নয় বরং এটি লকহিড মার্টিনের প্রাক্তন "স্কঙ্ক ওয়ার্কস" এর মত।

তথাকথিত "স্কঙ্ক ওয়ার্কস" একটি অত্যন্ত গোপনীয়, তুলনামূলকভাবে স্বাধীন ছোট দলকে বোঝায় যা লকহিড মার্টিন মূলত অনেক উন্নত বিমান তৈরির জন্য স্থাপন করেছিল, যা অত্যাধুনিক বা অপ্রচলিত প্রযুক্তি গবেষণা এবং উন্নয়নে নিযুক্ত ছিল। U-2 reconnaissance aircraft এবং SR-71 Blackbird থেকে F-22 Raptor এবং F-35 Lightning II ফাইটার, তারা সবাই এখান থেকে এসেছে।

পরে, শব্দটি ধীরে ধীরে একটি সাধারণ শব্দে বিকশিত হয় যা "ছোট কিন্তু সূক্ষ্ম" বর্ণনা করতে ব্যবহৃত হয়, তুলনামূলকভাবে স্বাধীন এবং আরও নমনীয় উদ্ভাবনী দলগুলি বড় কোম্পানি বা সংস্থার মধ্যে স্থাপন করা হয়।

তিনি দুটি কারণ দিয়েছেন:

একদিকে, DeepSeek-এর বিপুল সংখ্যক জিপিইউ রয়েছে, জানা গেছে 10,000-এর বেশি, এবং স্কেল এআই-এর সিইও আলেকজান্ডার ওয়াং এমনকি বলেছেন যে এটি 50,000-এ পৌঁছতে পারে৷
অন্যদিকে, DeepSeek শুধুমাত্র চীনের শীর্ষ তিনটি বিশ্ববিদ্যালয় থেকে প্রতিভা নিয়োগ করে, যার অর্থ হল DeepSeek আলিবাবা এবং টেনসেন্টের মতোই প্রতিযোগিতামূলক।

এই দুটি তথ্য একাই দেখায় যে DeepSeek স্পষ্টভাবে বাণিজ্যিক সাফল্য অর্জন করেছে এবং এই সম্পদগুলি পাওয়ার জন্য যথেষ্ট পরিচিত।

DeepSeek-এর উন্নয়ন ব্যয়ের জন্য, ব্লগার বলেছেন যে চীনা প্রযুক্তি কোম্পানিগুলি বিভিন্ন ধরনের ভর্তুকি পেতে পারে, যেমন কম বিদ্যুৎ খরচ এবং জমি ব্যবহার।

তাই, এটা খুবই সম্ভব যে DeepSeek-এর বেশিরভাগ খরচ মূল ব্যবসার বাইরের কোনো অ্যাকাউন্টে বা কোনো ধরনের ডেটা সেন্টার নির্মাণ ভর্তুকি আকারে "স্থাপিত" হয়েছে।

এমনকি প্রতিষ্ঠাতা ছাড়া, কেউ সমস্ত আর্থিক ব্যবস্থা পুরোপুরি বোঝে না। কিছু চুক্তি কেবলমাত্র "মৌখিক চুক্তি" হতে পারে যা শুধুমাত্র খ্যাতির উপর ভিত্তি করে চূড়ান্ত করা হয়।

যাই হোক না কেন, কয়েকটি বিষয় পরিষ্কার:

মডেলটি চমৎকার, দুই মাস আগে OpenAI দ্বারা প্রকাশিত সংস্করণের সাথে তুলনীয়, এবং অবশ্যই এটি সম্ভব যে এটি OpenAI এবং Anthropic এখনও যে নতুন মডেলগুলি প্রকাশ করেনি তার মতো ভালো নয়।
বর্তমান দৃষ্টিকোণ থেকে, গবেষণা দিক এখনও আমেরিকান কোম্পানি দ্বারা আধিপত্য হয়. DeepSeek মডেল হল o1 সংস্করণের একটি "দ্রুত ফলো-আপ", কিন্তু DeepSeek-এর গবেষণা ও উন্নয়নের অগ্রগতি খুব দ্রুত, প্রত্যাশিত সময়ের চেয়ে দ্রুত এগিয়ে চলেছে৷ তারা চুরি বা প্রতারণা করছে না, সর্বাধিক তারা বিপরীত প্রকৌশল।
DeepSeek মূলত আমেরিকান-প্রশিক্ষিত পিএইচডির উপর নির্ভর না করে নিজের প্রতিভাকে প্রশিক্ষণ দিচ্ছে, যা প্রতিভার পুলকে ব্যাপকভাবে প্রসারিত করে।
মার্কিন কোম্পানিগুলির তুলনায়, DeepSeek-এর বৌদ্ধিক সম্পত্তি লাইসেন্সিং, গোপনীয়তা, নিরাপত্তা, রাজনীতি ইত্যাদি ক্ষেত্রে কম সীমাবদ্ধতা রয়েছে এবং তথ্যের ভুল ব্যবহার সম্পর্কে কম উদ্বেগ রয়েছে যা সম্পর্কে লোকেরা প্রশিক্ষণ নিতে চায় না। কম মামলা, কম আইনজীবী এবং কম উদ্বেগ রয়েছে।

সন্দেহ নেই যে আরও বেশি সংখ্যক লোক বিশ্বাস করে যে 2025 একটি নির্ধারক বছর হবে। ইতিমধ্যে, সংস্থাগুলি এটির জন্য প্রস্তুতি নিচ্ছে। মেটা, উদাহরণস্বরূপ, 2025 সালের মধ্যে $60-65 বিলিয়ন আনুমানিক বিনিয়োগ সহ একটি 2GW+ ডেটা সেন্টার তৈরি করছে, এবং বছরের শেষ নাগাদ 1.3 মিলিয়নেরও বেশি GPU থাকবে৷

মেটা এমনকি ম্যানহাটন, নিউ ইয়র্কের সাথে তার 2-গিগাওয়াট ডেটা সেন্টারের তুলনা করার জন্য একটি চার্ট ব্যবহার করেছে।

কিন্তু এখন DeepSeek কম খরচে এবং কম জিপিইউ সহ আরও ভাল করেছে। এটা কিভাবে মানুষ উদ্বিগ্ন না করতে পারেন?

ইয়ান লেকুন: আমাদের সিটিও এবং এর সহ-প্রতিষ্ঠাতাকে ধন্যবাদ জানাতে হবে দ ওপেন সোর্স

হাইপারবোলিক, ইউচেন জিন, পোস্ট করার জন্য যে মাত্র 4 দিনের মধ্যে, DeepSeek-R1 আমাদের কাছে 4টি তথ্য প্রমাণ করেছে:

ক্লোজড সোর্স AI থেকে ওপেন সোর্স AI মাত্র 6 মাস পিছিয়ে
ওপেন সোর্স এআই প্রতিযোগিতায় চীন আধিপত্য বিস্তার করছে
আমরা বৃহৎ ভাষা মডেল শক্তিবৃদ্ধি শিক্ষার স্বর্ণযুগে প্রবেশ করছি
ডিস্টিলেশন মডেলগুলি খুব শক্তিশালী, এবং আমরা মোবাইল ফোনে অত্যন্ত বুদ্ধিমান AI চালাব

DeepSeek দ্বারা সৃষ্ট চেইন প্রতিক্রিয়া এখনও অব্যাহত রয়েছে, যেমন OpenAI o3-mini অবাধে উপলব্ধ করা হচ্ছে, সম্প্রদায়ের মধ্যে AGI/ASI সম্পর্কে অস্পষ্ট আলোচনা কমানোর আশা, এবং মেটা আতঙ্কের মধ্যে রয়েছে এমন গুজব।

তিনি বিশ্বাস করেন যে শেষ পর্যন্ত কে জিতবে তা ভবিষ্যদ্বাণী করা কঠিন, তবে আমাদের দেরিতে আসা সুবিধার শক্তি ভুলে যাওয়া উচিত নয়। সর্বোপরি, আমরা সবাই জানি যে গুগলই ট্রান্সফরমার আবিষ্কার করেছিল, যখন ওপেনএআই তার প্রকৃত সম্ভাবনাকে আনলক করেছিল।

এছাড়াও টুরিং পুরস্কার বিজয়ী এবং মেটার প্রধান এআই বিজ্ঞানী ইয়ান লেকুনও তার মতামত ব্যক্ত করেন।

“যারা DeepSeek-এর পারফরম্যান্স দেখে মনে করেন, 'চীন AI-তে মার্কিন যুক্তরাষ্ট্রকে ছাড়িয়ে যাচ্ছে,' আপনার ভুল আছে। সঠিক বোঝাপড়া হল যে ওপেন সোর্স মডেলগুলি মালিকানাধীন মডেলগুলিকে ছাড়িয়ে যাচ্ছে।"

LeCun বলেছেন যে DeepSeek এইবার এমন স্প্ল্যাশ করেছে কারণ তারা ওপেন রিসার্চ এবং ওপেন সোর্স (যেমন মেটা'স পাইটর্চ এবং লামা) থেকে উপকৃত হয়েছে। DeepSeek নতুন ধারণা নিয়ে এসেছে এবং অন্যদের কাজের উপর ভিত্তি করে তৈরি করেছে। কারণ তাদের কাজ পাবলিকলি রিলিজ এবং ওপেন সোর্স, সবাই এর থেকে উপকৃত হতে পারে। এটি ওপেন রিসার্চ এবং ওপেন সোর্সের শক্তি।

নেটিজেনদের প্রতিফলন অব্যাহত রয়েছে। যদিও তারা নতুন প্রযুক্তির বিকাশ নিয়ে উত্তেজিত, তারা কিছুটা উদ্বেগের পরিবেশও অনুভব করতে পারে। সব পরে, DeepSeekers উত্থান একটি বাস্তব প্রভাব থাকতে পারে.

অশ্রেণীভুক্ত

শীর্ষ চার মডেলের প্রতিযোগিতা! একটি পর্যালোচনা দেখায় যে ডিপসিক আর১ কতটা শক্তিশালী

দ্বারাzddeepseeker ১ জুন, ২০২৫১ জুন, ২০২৫

গত কয়েকদিন ধরে, Deepseek-R1 0528 আনুষ্ঠানিকভাবে ওপেন-সোর্স করা হয়েছে। LiveCodeBench-এ, এর পারফরম্যান্স প্রায় OpenAI-এর o3 (উচ্চ) এর সমান; Aider-এর বহু-ভাষা বেঞ্চমার্ক পরীক্ষায়, এটি Claude Opus-এর বিরুদ্ধে তার নিজস্ব অবস্থান ধরে রেখেছে। যখন এটি অফিসিয়াল ওয়েবসাইটে চালু করা হয়েছিল, তখন আমরা দ্রুত এর ফ্রন্ট-এন্ড ক্ষমতা পরীক্ষা করে দেখেছি যে সেগুলি ব্যতিক্রমী...

অশ্রেণীভুক্ত

এটি DeepSeek-R1-32B এর কাছাকাছি এবং Fei-Fei Li এর s1 কে চূর্ণ করে দেয়! UC Berkeley এবং অন্যান্য ওপেন সোর্স নতুন SOTA ইনফারেন্স মডেল

দ্বারাzddeepseeker অক্টোবর 14, 2025অক্টোবর 14, 2025

32B ইনফারেন্স মডেলটি মাত্র 1/8 ডেটা ব্যবহার করে এবং একই আকারের DeepSeek-R1 এর সাথে সংযুক্ত! এইমাত্র, স্ট্যানফোর্ড, ইউসি বার্কলে এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের মতো প্রতিষ্ঠানগুলি যৌথভাবে একটি SOTA-স্তরের ইনফারেন্স মডেল, OpenThinker-32B প্রকাশ করেছে এবং 114k পর্যন্ত প্রশিক্ষণ ডেটাও ওপেন-সোর্স করেছে। OpenThinker প্রকল্পের হোমপেজ: OpenThinker Hugging Face:…

অশ্রেণীভুক্ত

একশ বিলিয়ন ডলার বিনিয়োগের মাধ্যমে লে চ্যাট তালিকার শীর্ষে রয়েছে। মার্কিন যুক্তরাষ্ট্র এবং চীনের পরে, এটি কি তৃতীয় এআই শক্তি?

দ্বারাzddeepseeker অক্টোবর 11, 2025অক্টোবর 11, 2025

৯ ফেব্রুয়ারি, ফরাসি রাষ্ট্রপতি ইমানুয়েল ম্যাক্রোঁ ঘোষণা করেছেন যে ফ্রান্স আগামী কয়েক বছরে AI ক্ষেত্রে ১০৯ বিলিয়ন ইউরো (১১৩ বিলিয়ন মার্কিন ডলার) বিনিয়োগ করবে। এই বিনিয়োগ ফ্রান্সে একটি AI পার্ক তৈরি, অবকাঠামো উন্নত করা এবং স্থানীয় AI স্টার্ট-আপগুলিতে বিনিয়োগের জন্য ব্যবহার করা হবে। এদিকে, মিস্ট্রাল, একটি ফরাসি স্টার্টআপ,…

অশ্রেণীভুক্ত

DeepSeek R1 পেপারের ব্যাখ্যা এবং মূল প্রযুক্তিগত বিষয়গুলি

দ্বারাzddeepseeker অক্টোবর 9, 2025অক্টোবর 9, 2025

১ পটভূমি বসন্ত উৎসবের সময়, DeepSeek R1 আবারও ব্যাপক মনোযোগ আকর্ষণ করে, এমনকি আমরা পূর্বে যে DeepSeek V3 ব্যাখ্যামূলক প্রবন্ধটি লিখেছিলাম তাও পুনঃপ্রচারিত এবং প্রচুর আলোচনা করা হয়েছিল। যদিও DeepSeek R1 এর অনেক বিশ্লেষণ এবং পুনরুৎপাদন করা হয়েছে, এখানে আমরা কিছু সংশ্লিষ্ট পাঠ নোট সংকলন করার সিদ্ধান্ত নিয়েছি। আমরা তিনটি ব্যবহার করব...

অশ্রেণীভুক্ত

গুগল একসাথে তিনটি নতুন মডেল প্রকাশ করেছে: জেমিনি-২.০-প্রো বিনামূল্যে, অসাধারণ স্কোর রয়েছে এবং প্রথম স্থানে রয়েছে, এবং জটিল প্রম্পট কোডিং এবং প্রক্রিয়াকরণের জন্য উপযুক্ত!

দ্বারাzddeepseeker অক্টোবর 8, 2025অক্টোবর 8, 2025

জেমিনি ২.০ এর গল্প ত্বরান্বিত হচ্ছে। ডিসেম্বরে ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল সংস্করণটি ডেভেলপারদের জন্য কম ল্যাটেন্সি এবং উচ্চ কর্মক্ষমতা সহ একটি কার্যকরী মডেল নিয়ে এসেছে। এই বছরের শুরুতে, গুগল এআই স্টুডিওতে ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল আপডেট করা হয়েছিল যাতে ফ্ল্যাশের গতি এবং উন্নত অনুমান ক্ষমতা একত্রিত করে কর্মক্ষমতা আরও উন্নত করা যায়। গত সপ্তাহে,…

অশ্রেণীভুক্ত

Qwen2.5-max বনাম DeepSeek R1: মডেলগুলির একটি গভীর তুলনা: প্রয়োগের পরিস্থিতির একটি সম্পূর্ণ বিশ্লেষণ

দ্বারাzddeepseeker অক্টোবর 14, 2025অক্টোবর 14, 2025

ভূমিকা আজ, বৃহৎ ভাষা মডেল (LLM) একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। ২০২৫ সালের গোড়ার দিকে, AI-এর জন্য প্রতিযোগিতা তীব্র হওয়ার সাথে সাথে, Alibaba নতুন Qwen2.5-max AI মডেল চালু করে এবং চীনের Hangzhou-এর একটি কোম্পানি DeepSeek R1 মডেল চালু করে, যা LLM প্রযুক্তির শীর্ষস্থানকে প্রতিনিধিত্ব করে। Deepseek R1 হল একটি ওপেন সোর্স AI মডেল যা আকর্ষণ করেছে...

AI সার্কেলে, DeepSeek R1 শারীরিক পরীক্ষায় o1 এবং Claude কে স্থিরভাবে অতিক্রম করেছে এবং আমরা RL এর স্বর্ণযুগে প্রবেশ করেছি।

এটি কি "ভৌত আইন" এর নিজস্ব সিমুলেশন তৈরি করতে পারে?

DeepSeek হল নতুন "সিলিকন ভ্যালি মিথ৷

ইয়ান লেকুন: আমাদের সিটিও এবং এর সহ-প্রতিষ্ঠাতাকে ধন্যবাদ জানাতে হবে দ ওপেন সোর্স

শীর্ষ চার মডেলের প্রতিযোগিতা! একটি পর্যালোচনা দেখায় যে ডিপসিক আর১ কতটা শক্তিশালী

এটি DeepSeek-R1-32B এর কাছাকাছি এবং Fei-Fei Li এর s1 কে চূর্ণ করে দেয়! UC Berkeley এবং অন্যান্য ওপেন সোর্স নতুন SOTA ইনফারেন্স মডেল

DeepSeek R1 পেপারের ব্যাখ্যা এবং মূল প্রযুক্তিগত বিষয়গুলি

Qwen2.5-max বনাম DeepSeek R1: মডেলগুলির একটি গভীর তুলনা: প্রয়োগের পরিস্থিতির একটি সম্পূর্ণ বিশ্লেষণ

মন্তব্য করুন জবাব বাতিল

এটি কি "ভৌত আইন" এর নিজস্ব সিমুলেশন তৈরি করতে পারে?

DeepSeek হল নতুন "সিলিকন ভ্যালি মিথ৷

ইয়ান লেকুন: আমাদের সিটিও এবং এর সহ-প্রতিষ্ঠাতাকে ধন্যবাদ জানাতে হবে দ ওপেন সোর্স

অনুরূপ পোস্ট

মন্তব্য করুন জবাব বাতিল