আমরা কেউই আশা করিনি যে AI ক্ষেত্রে 2025 এভাবেই শুরু হবে।

DeepSeek R1 সত্যিই আশ্চর্যজনক!

সম্প্রতি, "রহস্যময় ইস্টার্ন পাওয়ার" DeepSeek সিলিকন ভ্যালিকে "কঠোর নিয়ন্ত্রণ" করেছে।

আমি R1 কে পিথাগোরাসের উপপাদ্যটি বিস্তারিতভাবে ব্যাখ্যা করতে বলেছিলাম। AI এই সমস্ত কাজ 30 সেকেন্ডেরও কম সময়ে কোন ভুল ছাড়াই সম্পন্ন করেছে। সংক্ষেপে, এটি শেষ।

দেশী এবং বিদেশী AI সার্কেলে, সাধারণ নেটিজেনরা আশ্চর্যজনক এবং শক্তিশালী নতুন AI আবিষ্কার করেছে (যা ওপেন সোর্সও বটে), এবং একাডেমিক বিশেষজ্ঞরা চিৎকার করেছেন "আমাদের অবশ্যই ধরতে হবে"৷ এমনও শোনা যাচ্ছে যে বিদেশী AI কোম্পানিগুলি ইতিমধ্যেই একটি বড় হুমকির সম্মুখীন হচ্ছে।

শুধু এই সপ্তাহে মুক্তি পাওয়া এই DeepSeek R1 নিন। কোনো তত্ত্বাবধানে প্রশিক্ষণ ছাড়াই এর বিশুদ্ধ শক্তিবৃদ্ধি শেখার পথ চমকপ্রদ। গত বছরের ডিসেম্বরে Deepseek-v3 বেসের বিকাশ থেকে ওপেনএআই o1-এর সাথে তুলনীয় বর্তমান চিন্তা চেইন সক্ষমতা পর্যন্ত, এটি সময়ের ব্যাপার বলে মনে হচ্ছে।

কিন্তু যখন এআই সম্প্রদায় প্রযুক্তিগত প্রতিবেদনগুলি পড়তে এবং প্রকৃত পরিমাপের তুলনা করতে ব্যস্ত, তখনও মানুষের মনে R1 সম্পর্কে সন্দেহ রয়েছে: একগুচ্ছ বেঞ্চমার্ককে ছাড়িয়ে যেতে সক্ষম হওয়া ছাড়াও, এটি কি সত্যিই নেতৃত্ব দিতে পারে?

এটি কি "ভৌত আইন" এর নিজস্ব সিমুলেশন তৈরি করতে পারে?

আপনি এটা বিশ্বাস করেন না? চলুন বড় মডেল একটি পিনবল সঙ্গে খেলা যাক?

সাম্প্রতিক দিনগুলিতে, এআই সম্প্রদায়ের কিছু লোক একটি পরীক্ষায় আচ্ছন্ন হয়ে পড়েছে - একটি সমস্যা সমাধানের জন্য বিভিন্ন এআই বড় মডেলগুলি (বিশেষ করে তথাকথিত যুক্তি মডেলগুলি) পরীক্ষা করে: “একটি নির্দিষ্ট ভিতরে হলুদ বল বাউন্স করতে একটি পাইথন স্ক্রিপ্ট লিখুন আকৃতি আকৃতিটি ধীরে ধীরে ঘোরান এবং নিশ্চিত করুন যে বলটি আকৃতির ভিতরে থাকে।"

কিছু মডেল এই "ঘূর্ণায়মান বল" বেঞ্চমার্কে অন্যদের ছাড়িয়ে যায়। CoreView CTO ইভান ফিওরাভান্তির মতে, DeepSeek, একটি গার্হস্থ্য কৃত্রিম বুদ্ধিমত্তা পরীক্ষাগার, একটি ওপেন সোর্স বড় মডেল R1 রয়েছে যা OpenAI-এর o1 প্রো মডেলকে ছাড়িয়ে যায়, যার দাম OpenAI-এর ChatGPT প্রো প্রোগ্রামের অংশ হিসাবে প্রতি মাসে $200।

বামদিকে OpenAI o1, এবং ডানদিকে DeepSeek R1। উপরে উল্লিখিত হিসাবে, এখানে প্রম্পটটি হল: “একটি বর্গক্ষেত্রের মধ্যে একটি বাউন্সিং হলুদ বলের জন্য একটি পাইথন স্ক্রিপ্ট লিখুন, সংঘর্ষ সনাক্তকরণ সঠিকভাবে পরিচালনা করা নিশ্চিত করুন৷ বর্গক্ষেত্রটিকে ধীরে ধীরে ঘোরান। এটি পাইথনে প্রয়োগ করুন। বল যেন স্কোয়ারের মধ্যে থাকে।"

X-এর অন্য ব্যবহারকারীর মতে, অ্যানথ্রপিক ক্লড 3.5 সনেট এবং গুগলের জেমিনি 1.5 প্রো মডেলগুলি ভৌত নীতিগুলি সম্পর্কে ভুল রায় দিয়েছে, যার ফলে বলটি তার আকৃতি থেকে বিচ্যুত হয়েছে। কিছু ব্যবহারকারী এও রিপোর্ট করেছেন যে Google এর সাম্প্রতিক জেমিনি 2.0 ফ্ল্যাশ থিঙ্কিং এক্সপেরিমেন্টাল, সেইসাথে তুলনামূলকভাবে পুরানো OpenAI GPT-4o, একবারে মূল্যায়ন পাস করেছে।

কিন্তু এখানে পার্থক্য বলার একটি উপায় আছে:

এই টুইটের অধীনে নেটিজেনরা বলেছেন: o1 এর ক্ষমতা মূলত খুব ভাল ছিল, কিন্তু OpenAI গতিকে অপ্টিমাইজ করার পরে এটি দুর্বল হয়ে পড়ে, এমনকি $200/মাস সদস্যপদ সংস্করণের সাথেও।

একটি বাউন্সিং বল অনুকরণ করা একটি ক্লাসিক প্রোগ্রামিং চ্যালেঞ্জ। নির্ভুল সিমুলেশন সংঘর্ষ সনাক্তকরণ অ্যালগরিদমগুলিকে একত্রিত করে, যা দুটি বস্তুর (যেমন একটি বল এবং একটি আকৃতির দিক) সংঘর্ষ হলে সনাক্ত করতে হবে। একটি ভুলভাবে লিখিত অ্যালগরিদম সিমুলেশনের কর্মক্ষমতা প্রভাবিত করতে পারে বা স্পষ্ট শারীরিক ত্রুটির কারণ হতে পারে।

এন৮ প্রোগ্রামস, এআই স্টার্টআপ নউস রিসার্চের একজন গবেষক বলেছেন, স্ক্র্যাচ থেকে ঘূর্ণায়মান হেপ্টাগনে বাউন্সিং বল লিখতে তার প্রায় দুই ঘণ্টা সময় লেগেছে। "একাধিক স্থানাঙ্ক সিস্টেমগুলিকে অবশ্যই ট্র্যাক করতে হবে, প্রতিটি সিস্টেমে সংঘর্ষগুলি কীভাবে পরিচালনা করা হয় তা বোঝার প্রয়োজন, এবং কোডটি অবশ্যই স্ক্র্যাচ থেকে শক্তিশালী হতে ডিজাইন করা উচিত।"

যদিও বাউন্সিং বল এবং স্পিনিং শেপ প্রোগ্রামিং দক্ষতার একটি যুক্তিসঙ্গত পরীক্ষা, তবুও এগুলি বড় মডেলের জন্য নতুন প্রজেক্ট, এমনকি প্রম্পটে ছোট পরিবর্তনও বিভিন্ন ফলাফল আনতে পারে। সুতরাং যদি এটি শেষ পর্যন্ত বড় AI মডেলগুলির জন্য বেঞ্চমার্ক পরীক্ষার অংশ হয়ে ওঠে, তবে এটি এখনও উন্নত করা দরকার।

যাই হোক না কেন, ব্যবহারিক পরীক্ষার এই তরঙ্গের পরে, আমরা বৃহৎ মডেলগুলির মধ্যে ক্ষমতার পার্থক্যের ধারনা পেয়েছি।

DeepSeek হল নতুন "সিলিকন ভ্যালি মিথ৷

DeepSeek প্যাসিফিক জুড়ে আতঙ্ক সৃষ্টি করছে।

মেটা কর্মীরা পোস্ট করেছেন যে "মেটা ইঞ্জিনিয়াররা উন্মত্তভাবে DeepSeek বিশ্লেষণ করছে যাতে তারা এটি থেকে যে কোনও কিছু অনুলিপি করার চেষ্টা করে।"

এআই প্রযুক্তি স্টার্টআপ স্কেল এআই-এর প্রতিষ্ঠাতা আলেকজান্ডার ওয়াংও প্রকাশ্যে বলেছেন যে DeepSeek-এর AI বড় মডেলের কার্যক্ষমতা মোটামুটি মার্কিন যুক্তরাষ্ট্রের সেরা মডেলের সমতুল্য।

তিনি আরও বিশ্বাস করেন যে মার্কিন যুক্তরাষ্ট্র গত এক দশকে এআই প্রতিযোগিতায় চীনের চেয়ে এগিয়ে থাকতে পারে, তবে DeepSeek এর AI বড় মডেলের প্রকাশ "সবকিছু পরিবর্তন করতে পারে।"

X ব্লগার @8teAPi বিশ্বাস করে যে DeepSeek একটি "সাইড প্রজেক্ট" নয় বরং এটি লকহিড মার্টিনের প্রাক্তন "স্কঙ্ক ওয়ার্কস" এর মত।

তথাকথিত "স্কঙ্ক ওয়ার্কস" একটি অত্যন্ত গোপনীয়, তুলনামূলকভাবে স্বাধীন ছোট দলকে বোঝায় যা লকহিড মার্টিন মূলত অনেক উন্নত বিমান তৈরির জন্য স্থাপন করেছিল, যা অত্যাধুনিক বা অপ্রচলিত প্রযুক্তি গবেষণা এবং উন্নয়নে নিযুক্ত ছিল। U-2 reconnaissance aircraft এবং SR-71 Blackbird থেকে F-22 Raptor এবং F-35 Lightning II ফাইটার, তারা সবাই এখান থেকে এসেছে।

পরে, শব্দটি ধীরে ধীরে একটি সাধারণ শব্দে বিকশিত হয় যা "ছোট কিন্তু সূক্ষ্ম" বর্ণনা করতে ব্যবহৃত হয়, তুলনামূলকভাবে স্বাধীন এবং আরও নমনীয় উদ্ভাবনী দলগুলি বড় কোম্পানি বা সংস্থার মধ্যে স্থাপন করা হয়।

তিনি দুটি কারণ দিয়েছেন:

  • একদিকে, DeepSeek-এর বিপুল সংখ্যক জিপিইউ রয়েছে, জানা গেছে 10,000-এর বেশি, এবং স্কেল এআই-এর সিইও আলেকজান্ডার ওয়াং এমনকি বলেছেন যে এটি 50,000-এ পৌঁছতে পারে৷
  • অন্যদিকে, DeepSeek শুধুমাত্র চীনের শীর্ষ তিনটি বিশ্ববিদ্যালয় থেকে প্রতিভা নিয়োগ করে, যার অর্থ হল DeepSeek আলিবাবা এবং টেনসেন্টের মতোই প্রতিযোগিতামূলক।

এই দুটি তথ্য একাই দেখায় যে DeepSeek স্পষ্টভাবে বাণিজ্যিক সাফল্য অর্জন করেছে এবং এই সম্পদগুলি পাওয়ার জন্য যথেষ্ট পরিচিত।

DeepSeek-এর উন্নয়ন ব্যয়ের জন্য, ব্লগার বলেছেন যে চীনা প্রযুক্তি কোম্পানিগুলি বিভিন্ন ধরনের ভর্তুকি পেতে পারে, যেমন কম বিদ্যুৎ খরচ এবং জমি ব্যবহার।

তাই, এটা খুবই সম্ভব যে DeepSeek-এর বেশিরভাগ খরচ মূল ব্যবসার বাইরের কোনো অ্যাকাউন্টে বা কোনো ধরনের ডেটা সেন্টার নির্মাণ ভর্তুকি আকারে "স্থাপিত" হয়েছে।

এমনকি প্রতিষ্ঠাতা ছাড়া, কেউ সমস্ত আর্থিক ব্যবস্থা পুরোপুরি বোঝে না। কিছু চুক্তি কেবলমাত্র "মৌখিক চুক্তি" হতে পারে যা শুধুমাত্র খ্যাতির উপর ভিত্তি করে চূড়ান্ত করা হয়।

যাই হোক না কেন, কয়েকটি বিষয় পরিষ্কার:

  • মডেলটি চমৎকার, দুই মাস আগে OpenAI দ্বারা প্রকাশিত সংস্করণের সাথে তুলনীয়, এবং অবশ্যই এটি সম্ভব যে এটি OpenAI এবং Anthropic এখনও যে নতুন মডেলগুলি প্রকাশ করেনি তার মতো ভালো নয়।
  • বর্তমান দৃষ্টিকোণ থেকে, গবেষণা দিক এখনও আমেরিকান কোম্পানি দ্বারা আধিপত্য হয়. DeepSeek মডেল হল o1 সংস্করণের একটি "দ্রুত ফলো-আপ", কিন্তু DeepSeek-এর গবেষণা ও উন্নয়নের অগ্রগতি খুব দ্রুত, প্রত্যাশিত সময়ের চেয়ে দ্রুত এগিয়ে চলেছে৷ তারা চুরি বা প্রতারণা করছে না, সর্বাধিক তারা বিপরীত প্রকৌশল।
  • DeepSeek মূলত আমেরিকান-প্রশিক্ষিত পিএইচডির উপর নির্ভর না করে নিজের প্রতিভাকে প্রশিক্ষণ দিচ্ছে, যা প্রতিভার পুলকে ব্যাপকভাবে প্রসারিত করে।
  • মার্কিন কোম্পানিগুলির তুলনায়, DeepSeek-এর বৌদ্ধিক সম্পত্তি লাইসেন্সিং, গোপনীয়তা, নিরাপত্তা, রাজনীতি ইত্যাদি ক্ষেত্রে কম সীমাবদ্ধতা রয়েছে এবং তথ্যের ভুল ব্যবহার সম্পর্কে কম উদ্বেগ রয়েছে যা সম্পর্কে লোকেরা প্রশিক্ষণ নিতে চায় না। কম মামলা, কম আইনজীবী এবং কম উদ্বেগ রয়েছে।

সন্দেহ নেই যে আরও বেশি সংখ্যক লোক বিশ্বাস করে যে 2025 একটি নির্ধারক বছর হবে। ইতিমধ্যে, সংস্থাগুলি এটির জন্য প্রস্তুতি নিচ্ছে। মেটা, উদাহরণস্বরূপ, 2025 সালের মধ্যে $60-65 বিলিয়ন আনুমানিক বিনিয়োগ সহ একটি 2GW+ ডেটা সেন্টার তৈরি করছে, এবং বছরের শেষ নাগাদ 1.3 মিলিয়নেরও বেশি GPU থাকবে৷

মেটা এমনকি ম্যানহাটন, নিউ ইয়র্কের সাথে তার 2-গিগাওয়াট ডেটা সেন্টারের তুলনা করার জন্য একটি চার্ট ব্যবহার করেছে।

কিন্তু এখন DeepSeek কম খরচে এবং কম জিপিইউ সহ আরও ভাল করেছে। এটা কিভাবে মানুষ উদ্বিগ্ন না করতে পারেন?

ইয়ান লেকুন: আমাদের সিটিও এবং এর সহ-প্রতিষ্ঠাতাকে ধন্যবাদ জানাতে হবে ওপেন সোর্স

হাইপারবোলিক, ইউচেন জিন, পোস্ট করার জন্য যে মাত্র 4 দিনের মধ্যে, DeepSeek-R1 আমাদের কাছে 4টি তথ্য প্রমাণ করেছে:

  • ক্লোজড সোর্স AI থেকে ওপেন সোর্স AI মাত্র 6 মাস পিছিয়ে
  • ওপেন সোর্স এআই প্রতিযোগিতায় চীন আধিপত্য বিস্তার করছে
  • আমরা বৃহৎ ভাষা মডেল শক্তিবৃদ্ধি শিক্ষার স্বর্ণযুগে প্রবেশ করছি
  • ডিস্টিলেশন মডেলগুলি খুব শক্তিশালী, এবং আমরা মোবাইল ফোনে অত্যন্ত বুদ্ধিমান AI চালাব

DeepSeek দ্বারা সৃষ্ট চেইন প্রতিক্রিয়া এখনও অব্যাহত রয়েছে, যেমন OpenAI o3-mini অবাধে উপলব্ধ করা হচ্ছে, সম্প্রদায়ের মধ্যে AGI/ASI সম্পর্কে অস্পষ্ট আলোচনা কমানোর আশা, এবং মেটা আতঙ্কের মধ্যে রয়েছে এমন গুজব।

তিনি বিশ্বাস করেন যে শেষ পর্যন্ত কে জিতবে তা ভবিষ্যদ্বাণী করা কঠিন, তবে আমাদের দেরিতে আসা সুবিধার শক্তি ভুলে যাওয়া উচিত নয়। সর্বোপরি, আমরা সবাই জানি যে গুগলই ট্রান্সফরমার আবিষ্কার করেছিল, যখন ওপেনএআই তার প্রকৃত সম্ভাবনাকে আনলক করেছিল।

এছাড়াও টুরিং পুরস্কার বিজয়ী এবং মেটার প্রধান এআই বিজ্ঞানী ইয়ান লেকুনও তার মতামত ব্যক্ত করেন।

“যারা DeepSeek-এর পারফরম্যান্স দেখে মনে করেন, 'চীন AI-তে মার্কিন যুক্তরাষ্ট্রকে ছাড়িয়ে যাচ্ছে,' আপনার ভুল আছে। সঠিক বোঝাপড়া হল যে ওপেন সোর্স মডেলগুলি মালিকানাধীন মডেলগুলিকে ছাড়িয়ে যাচ্ছে।"

LeCun বলেছেন যে DeepSeek এইবার এমন স্প্ল্যাশ করেছে কারণ তারা ওপেন রিসার্চ এবং ওপেন সোর্স (যেমন মেটা'স পাইটর্চ এবং লামা) থেকে উপকৃত হয়েছে। DeepSeek নতুন ধারণা নিয়ে এসেছে এবং অন্যদের কাজের উপর ভিত্তি করে তৈরি করেছে। কারণ তাদের কাজ পাবলিকলি রিলিজ এবং ওপেন সোর্স, সবাই এর থেকে উপকৃত হতে পারে। এটি ওপেন রিসার্চ এবং ওপেন সোর্সের শক্তি।

নেটিজেনদের প্রতিফলন অব্যাহত রয়েছে। যদিও তারা নতুন প্রযুক্তির বিকাশ নিয়ে উত্তেজিত, তারা কিছুটা উদ্বেগের পরিবেশও অনুভব করতে পারে। সব পরে, DeepSeekers উত্থান একটি বাস্তব প্রভাব থাকতে পারে.

অনুরূপ পোস্ট

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।