ভবিষ্যতে, আরো এবং আরো হার্ডকোর উদ্ভাবন হবে. এটি এখন বোঝা সহজ নয়, কারণ সমগ্র সামাজিক গোষ্ঠীকে তথ্য দ্বারা শিক্ষিত করা দরকার। এই সমাজ যখন হার্ডকোর উদ্ভাবনকারী লোকদের সফল হতে দেয়, তখন যৌথ মানসিকতা পরিবর্তন হবে। আমাদের শুধু একগুচ্ছ তথ্য এবং একটি প্রক্রিয়া দরকার। — লিয়াং ওয়েনফেং, DeepSeek-এর প্রতিষ্ঠাতা
সাম্প্রতিক দিনগুলিতে, DeepSeek সারা বিশ্বে বিস্ফোরিত হয়েছে, কিন্তু যেহেতু কোম্পানিটি খুবই কম এবং কোনো ঘোষণা দেয়নি, তাই জনসাধারণ এই প্রযুক্তি কোম্পানি সম্পর্কে খুব কমই জানে যেটি বিশাল সম্ভাবনা রয়েছে - এটি এর প্রতিষ্ঠাতা প্রেক্ষাপট, ব্যবসার সুযোগ হোক না কেন , বা পণ্য বিন্যাস.
সমস্ত উপকরণের মাধ্যমে বাছাই শেষ করার পরে, আমি এই নিবন্ধটি লিখেছিলাম
বর্তমান এআই প্লেয়ারদের পটভূমি কী, তারা কী করছে এবং তারা কাদের নিয়োগ করছে?
এবং সম্ভবত DeepSeek এর সবচেয়ে সম্পূর্ণ ঐতিহাসিক ওভারভিউ।
এইবার গত বছর, ম্যাজিক কিউব কোয়ান্টের এক বন্ধু আমার কাছে এসে জিজ্ঞেস করল, "আপনি কি চীনে একটি বড় মডেল তৈরি করতে চান?" এবং আমি কেবল কফি পান করে বিকেলটা কাটিয়েছি। প্রত্যাশিত হিসাবে, জীবন এখনও পছন্দ উপর নির্ভর করে.
দ এখানে উল্লেখিত ম্যাজিক কিউব কোয়ান্ট হচ্ছে বিনিয়োগকারী, বা DeepSeek এর মূল কোম্পানি।
তথাকথিত "কোয়ান্ট" হল একটি বিনিয়োগ প্রতিষ্ঠান যা মানুষের শক্তি দ্বারা নয় বরং অ্যালগরিদম দ্বারা সিদ্ধান্ত নেয়। কোয়ান্ট ফ্যান্টাসি প্রতিষ্ঠা বেশি দিন নয়, 2015 সালে শুরু হয়েছিল। 2021 নাগাদ, যখন এটির বয়স ছয় বছর ছিল, কোয়ান্ট ফ্যান্টাসির সম্পদ ব্যবস্থাপনা স্কেল 100 বিলিয়ন ছাড়িয়ে গিয়েছিল, এবং এটিকে চীনের "চারটি মহান কোয়ান্ট কিং" এর মধ্যে একটি হিসাবে সমাদৃত করা হয়েছিল।
ফ্যান্টাসি স্কোয়ারের প্রতিষ্ঠাতা, লিয়াং ওয়েনফেং, যিনি DeepSeek-এরও প্রতিষ্ঠাতা, 1980-এর দশকে জন্মগ্রহণকারী একজন "নন-মেনস্ট্রিম" আর্থিক নেতা: তার কোনো বিদেশী অধ্যয়নের অভিজ্ঞতা নেই, তিনি অলিম্পিক প্রতিযোগিতায় বিজয়ী নন, এবং কৃত্রিম বুদ্ধিমত্তায় প্রধান হয়ে ঝেজিয়াং বিশ্ববিদ্যালয়ের ইলেকট্রনিক ইঞ্জিনিয়ারিং বিভাগ থেকে স্নাতক হয়েছেন। তিনি একজন নেটিভ টেকনোলজি বিশেষজ্ঞ যিনি প্রতিদিন "কাগজপত্র পড়া, কোড লেখা এবং গ্রুপ আলোচনায় অংশগ্রহণ" কম-কী পদ্ধতিতে কাজ করেন।
লিয়াং ওয়েনফেং-এর কোনও ঐতিহ্যবাহী ব্যবসায়ী মালিকের অভ্যাস নেই, বরং তিনি একজন খাঁটি "টেক গীক"-এর মতো।. অনেক শিল্পের অভ্যন্তরীণ ব্যক্তি এবং DeepSeek গবেষকরা লিয়াং ওয়েনফেংকে অত্যন্ত উচ্চ প্রশংসা করেছেন: "এমন কেউ যার শক্তিশালী ইনফ্রা ইঞ্জিনিয়ারিং ক্ষমতা এবং মডেল গবেষণা ক্ষমতা উভয়ই রয়েছে, এবং সম্পদও সংগ্রহ করতে পারে," "এমন কেউ যিনি উচ্চ স্তর থেকে সঠিক রায় দিতে পারেন, তবে তিনিও শ্রেষ্ঠত্ব অর্জন করতে পারেন। সামনের সারির গবেষকদের উপর বিশদ বিবরণে" এবং "একটি ভয়ঙ্কর শেখার ক্ষমতা" রয়েছে।
DeepSeek প্রতিষ্ঠিত হওয়ার অনেক আগে, Huanfang ইতিমধ্যে AI শিল্পে দীর্ঘমেয়াদী পরিকল্পনা করতে শুরু করেছিল. 2023 সালের মে মাসে, লিয়াং ওয়েনফেং ডার্কসার্জের সাথে একটি সাক্ষাত্কারে উল্লেখ করেছিলেন: “2020 সালে OpenAI GPT3 প্রকাশ করার পরে, AI বিকাশের দিকটি খুব স্পষ্ট হয়ে উঠেছে, এবং কম্পিউটিং শক্তি একটি মূল উপাদান হয়ে উঠবে; কিন্তু এমনকি 2021 সালে, যখন আমরা ফায়ারফ্লাই 2 নির্মাণে বিনিয়োগ করেছি, তখনও বেশিরভাগ মানুষ এটি বুঝতে পারেনি।”
এই রায়ের উপর ভিত্তি করে, হুয়ানফাং তার নিজস্ব কম্পিউটিং অবকাঠামো তৈরি করতে শুরু করে। “প্রাথমিক 1 কার্ড থেকে, 2015 সালে 100 কার্ড, 2019 সালে 1,000 কার্ড এবং তারপর 10,000 কার্ড, এই প্রক্রিয়াটি ধীরে ধীরে ঘটেছে। কয়েকশ কার্ডের আগে, আমরা একটি আইডিসিতে হোস্ট ছিলাম। স্কেলটি বড় হয়ে গেলে, হোস্টিং আর প্রয়োজনীয়তা পূরণ করতে পারে না, তাই আমরা আমাদের নিজস্ব কম্পিউটার রুম তৈরি করতে শুরু করি।"
পরে ফাইন্যান্স ইলেভেন জানায়, “পাঁচটির বেশি নেই 10,000 টিরও বেশি GPU সহ দেশীয় সংস্থাগুলি এবং কয়েকটি বড় নির্মাতার পাশাপাশি, তারা ম্যাজিক কিউব নামে একটি পরিমাণগত তহবিল সংস্থাও অন্তর্ভুক্ত করে" এটি সাধারণত বিশ্বাস করা হয় যে 10,000 Nvidia A100 চিপগুলি বড় মডেলগুলিকে প্রশিক্ষণ দেওয়ার জন্য কম্পিউটিং শক্তির থ্রেশহোল্ড।
পূর্ববর্তী সাক্ষাত্কারে, লিয়াং ওয়েনফেং একটি আকর্ষণীয় বিষয় উল্লেখ করেছেন: অনেকেই ভাববেন এর পিছনে কোনও অজানা ব্যবসায়িক যুক্তি আছে, কিন্তু বাস্তবে, এটি মূলত কৌতূহল দ্বারা চালিত।
DeepSeekপ্রথম সাক্ষাৎ
2023 সালের মে মাসে ডার্কসার্জের সাথে একটি সাক্ষাত্কারে, যখন জিজ্ঞাসা করা হয়েছিল "কিছুদিন আগে, Huanfang তার বড় মডেল তৈরির সিদ্ধান্ত ঘোষণা করেছে, কেন একটি পরিমাণগত তহবিল এমন কাজ করবে?"
লিয়াং ওয়েনফেং-এর উত্তর ছিল ধ্বনিত: “একটি বড় মডেল তৈরি করার আমাদের সিদ্ধান্তের পরিমাণ নির্ধারণ বা অর্থায়নের সাথে কোন সম্পর্ক নেই। আমরা এটি করার জন্য DeepSeek নামে একটি নতুন কোম্পানি স্থাপন করেছি। মিয়ানফাং-এ দলের মূল সদস্যদের অনেকেই কৃত্রিম বুদ্ধিমত্তার সাথে জড়িত। সেই সময়ে, আমরা অনেক পরিস্থিতিতে চেষ্টা করেছি এবং অবশেষে অর্থের উপর স্থির হয়েছি, যা যথেষ্ট জটিল। সাধারণ কৃত্রিম বুদ্ধিমত্তা অর্জন করা পরবর্তী সবচেয়ে কঠিন জিনিসগুলির মধ্যে একটি হতে পারে, তাই আমাদের জন্য, এটি কীভাবে করা যায় তা একটি প্রশ্ন, কেন নয়।
বাণিজ্যিক স্বার্থ বা বাজারের প্রবণতা তাড়া করে নয়, বরং AGI প্রযুক্তি নিজেই অন্বেষণ করার ইচ্ছা এবং "সবচেয়ে গুরুত্বপূর্ণ এবং কঠিন জিনিস" এর অবিরাম সাধনা দ্বারা চালিত। "DeepSeek" নামটি আনুষ্ঠানিকভাবে ২০২৩ সালের মে মাসে নিশ্চিত করা হয়েছিল।। ১৭ জুলাই, ২০২৩ তারিখে, “Hangzhou DeepSeek কৃত্রিম বুদ্ধিমত্তা বেসিক টেকনোলজি রিসার্চ কোং, লিমিটেড” অন্তর্ভুক্ত করা হয়।
চালু নভেম্বর 2, 2023, DeepSeek তার প্রথম উত্তর প্রদান করেছে: DeepSeek কোডার, ওপেন সোর্স কোডের একটি বড় মডেল. এই মডেলটিতে 1B, 7B, এবং 33B এর মতো একাধিক মাপ রয়েছে। ওপেন সোর্স কন্টেন্টের মধ্যে রয়েছে বেস মডেল এবং কমান্ড টিউনিং মডেল।
সেই সময়ে, ওপেন সোর্স মডেলগুলির মধ্যে, মেটার কোডলামা ছিল ইন্ডাস্ট্রির বেঞ্চমার্ক। যাইহোক, একবার DeepSeek কোডার রিলিজ করা হলে, এটি CodeLlama-এর তুলনায় একটি বহুমুখী অগ্রণী অবস্থান প্রদর্শন করে: কোড জেনারেশনে, HumanEval ছিল 9.3% এগিয়ে, MBPP ছিল 10.8% এগিয়ে, এবং DS-1000 ছিল 5.9% এগিয়ে৷
মনে রাখবেন যে DeepSeek কোডার একটি 7B মডেল, যখন CodeLlama একটি 34B মডেল। এছাড়াও, DeepSeek কোডার মডেলটি, নির্দেশাবলীর সাথে সুরক্ষিত হওয়ার পরে, GPT3.5-Turbo কে ব্যাপকভাবে ছাড়িয়ে গেছে।
শুধুমাত্র কোড জেনারেশনই চিত্তাকর্ষক নয়, DeepSeek কোডারও গণিত এবং যুক্তিতে তার পেশীগুলি দেখায়।
তিন দিন পরে, 5 নভেম্বর, 2023-এ, DeepSeek তার WeChat পাবলিক অ্যাকাউন্টের মাধ্যমে প্রচুর পরিমাণে নিয়োগের বিষয়বস্তু প্রকাশ করেছে, যার মধ্যে রয়েছে AGI বড় মডেল ইন্টার্ন, ডেটা বিশেষজ্ঞ, ডেটা আর্কিটেকচার প্রতিভা, সিনিয়র ডেটা সংগ্রহ প্রকৌশলী, গভীর শিক্ষার গবেষণা এবং উন্নয়নের মতো পদ। প্রকৌশলী, ইত্যাদি এবং সক্রিয়ভাবে দল প্রসারিত করতে শুরু করে।
যেমন লিয়াং ওয়েনফেং বলেছেন, প্রতিভা নিয়োগের জন্য DeepSeek-এর "অবশ্যই প্রয়োজনীয়তা" হল "আবেগ এবং কঠিন মৌলিক দক্ষতা", এবং তিনি জোর দিয়েছিলেন যে "উদ্ভাবনের জন্য যতটা সম্ভব কম হস্তক্ষেপ এবং ব্যবস্থাপনা প্রয়োজন, যাতে প্রত্যেকের ভুল করার এবং নতুন জিনিস চেষ্টা করার স্বাধীনতা থাকে। উদ্ভাবন প্রায়শই ভিতরে থেকে আসে, ইচ্ছাকৃত ব্যবস্থা থেকে নয় এবং এটি অবশ্যই শিক্ষা থেকে আসে না।"
মডেলগুলি প্রায়শই প্রকাশিত হয় এবং ওপেন সোর্স অনুশীলন করা হয়
DeepSeek কোডার একটি স্প্ল্যাশ করার পরে, DeepSeek প্রধান যুদ্ধক্ষেত্রের দিকে মনোযোগ দেয়: সাধারণ ভাষা মডেল।
চালু নভেম্বর 29, 2023, DeepSeek তার প্রথম সাধারণ-উদ্দেশ্য বড় ভাষা মডেল, DeepSeek LLM 67B প্রকাশ করেছে। এই মডেলটি একই স্তরের Meta এর LLaMA2 70B মডেলের বিপরীতে বেঞ্চমার্ক করা হয়েছে এবং চীনা এবং ইংরেজিতে প্রায় 20টি পাবলিক মূল্যায়ন তালিকায় আরও ভাল পারফর্ম করেছে। বিশেষ করে, এর যুক্তি, গণিত, এবং প্রোগ্রামিং ক্ষমতা (যেমন, HumanEval, MATH, CEval, এবং CMMLU) অসামান্য।
DeepSeek LLM 67B ওপেন সোর্স রুটও বেছে নিয়েছে এবং বাণিজ্যিক ব্যবহার সমর্থন করে। ওপেন সোর্সের প্রতি তার আন্তরিকতা এবং সংকল্প আরও প্রদর্শনের জন্য, DeepSeek, অভূতপূর্বভাবে, একই সাথে বিভিন্ন স্কেলের দুটি মডেল, 7B এবং 67B উন্মুক্ত করেছে, এবং এমনকি গবেষকদের ডাউনলোড এবং ব্যবহার করার জন্য মডেল প্রশিক্ষণ প্রক্রিয়া চলাকালীন উত্পন্ন নয়টি চেকপয়েন্টকে সর্বজনীন করেছে। এই ধরনের অপারেশন, যা "সবকিছু শেখানোর" অনুরূপ, সমগ্র ওপেন সোর্স সম্প্রদায়ে অত্যন্ত বিরল।
DeepSeek LLM 67B এর প্রকৃত ক্ষমতা আরও ব্যাপক এবং বস্তুনিষ্ঠভাবে মূল্যায়ন করার জন্য, DeepSeek গবেষণা দল "স্ট্রেস টেস্টিং" এর জন্য "নতুন প্রশ্ন" এর একটি সিরিজ সাবধানতার সাথে ডিজাইন করেছে। এই প্রশ্নগুলিতে হাঙ্গেরিয়ান হাই স্কুল গণিত পরীক্ষার প্রশ্ন, গুগল কমান্ড অনুসরণ মূল্যায়ন সেট এবং লিটকোড সাপ্তাহিক প্রতিযোগিতার প্রশ্নগুলির মতো উচ্চ-স্তরের, উচ্চ-বৈষম্যমূলক পরীক্ষাগুলি অন্তর্ভুক্ত রয়েছে। পরীক্ষার ফলাফলগুলি উৎসাহব্যঞ্জক ছিল। DeepSeek LLM 67B নমুনার বাইরে সাধারণীকরণের ক্ষমতার দিক থেকে আশ্চর্যজনক সম্ভাবনা দেখিয়েছিল এবং এর সামগ্রিক কর্মক্ষমতা তৎকালীন সবচেয়ে উন্নত GPT-4 মডেলের কাছাকাছি ছিল।
চালু ডিসেম্বর 18, 2023, DeepSeek খোলা উৎস ভিনসেন্ট 3D মডেল DreamCraft3D: এটি একটি বাক্য থেকে উচ্চ-মানের 3D মডেল তৈরি করতে পারে, AIGC-তে 2D প্লেন থেকে 3D স্পেসে লাফিয়ে উঠতে পারে। উদাহরণস্বরূপ, যদি ব্যবহারকারী ইনপুট দেয়: "জঙ্গলের মধ্যে দিয়ে দৌড়ানো, একটি শূকরের মাথার একটি মজার হাইব্রিড ছবি এবং বানর রাজার দেহ," DreamCraft3D উচ্চ মানের সামগ্রী আউটপুট করতে পারে:
নীতিগতভাবে, মডেলটি প্রথমে ভেন ডায়াগ্রামটি সম্পূর্ণ করে এবং তারপর 2D ধারণা মানচিত্রের উপর ভিত্তি করে সামগ্রিক জ্যামিতিক কাঠামোর পরিপূরক করে:
এর পরের বিষয়ভিত্তিক মূল্যায়নে, 90% এর বেশি ব্যবহারকারী বলেছেন যে ড্রিমক্রাফ্ট 3D-এর আগের প্রজন্মের পদ্ধতির তুলনায় প্রজন্মের গুণমানে একটি সুবিধা রয়েছে।
7 জানুয়ারী, 2024-এ, DeepSeek DeepSeek LLM 67B প্রযুক্তিগত প্রতিবেদন প্রকাশ করেছে। এই ৪০+ পৃষ্ঠার প্রতিবেদনে DeepSeek LLM 67B এর অনেক বিবরণ রয়েছে, যার মধ্যে রয়েছে স্ব-নির্মিত স্কেলিং আইন, মডেল সারিবদ্ধকরণের সম্পূর্ণ ব্যবহারিক বিবরণ এবং একটি বিস্তৃত AGI ক্ষমতা মূল্যায়ন ব্যবস্থা।
চালু জানুয়ারী 11, 2024, DeepSeek চীনে প্রথম MoE (মিশ্র বিশেষজ্ঞ আর্কিটেকচার) বড় মডেলটি উন্মুক্ত করেছে, DeepSeekMoE: একটি একেবারে নতুন স্থাপত্য যা চীনা এবং ইংরেজি সমর্থন করে এবং বাণিজ্যিক ব্যবহারের জন্য বিনামূল্যে। সেই সময়ে MoE আর্কিটেকচারকে সাধারণত OpenAI GPT-4 এর পারফরম্যান্স অগ্রগতির মূল চাবিকাঠি হিসেবে বিবেচনা করা হত। DeepSeek এর স্ব-উন্নত MoE আর্কিটেকচার 2B, 16B এবং 145B এর মতো একাধিক স্কেলে নেতৃত্ব দিচ্ছে এবং এর কম্পিউটেশনালও খুবই প্রশংসনীয়।
২৫ জানুয়ারী, ২০২৪ তারিখে, DeepSeek DeepSeek কোডার প্রযুক্তিগত প্রতিবেদন প্রকাশ করে। এই প্রতিবেদনটি এর প্রশিক্ষণের তথ্য, প্রশিক্ষণের পদ্ধতি এবং মডেল কর্মক্ষমতার একটি ব্যাপক প্রযুক্তিগত বিশ্লেষণ প্রদান করে। এই প্রতিবেদনে, আমরা দেখতে পাচ্ছি যে প্রথমবারের মতো, এটি গুদাম-স্তরের কোড ডেটা তৈরি করেছে এবং ফাইলগুলির মধ্যে নির্ভরতা বিশ্লেষণ করতে টপোলজিকাল বাছাই ব্যবহার করেছে, দীর্ঘ-দূরত্বের ক্রস-ফাইলগুলি বোঝার ক্ষমতা উল্লেখযোগ্যভাবে বাড়িয়েছে। প্রশিক্ষণ পদ্ধতির পরিপ্রেক্ষিতে, ফিল-ইন-মিডল পদ্ধতি যোগ করা হয়েছিল, যা কোড সমাপ্তির ক্ষমতাকে ব্যাপকভাবে উন্নত করেছে।
30 জানুয়ারী, 2024-এ, DeepSeek ওপেন প্ল্যাটফর্মটি আনুষ্ঠানিকভাবে চালু হয়েছিল, এবং DeepSeek বড় মডেল API পরিষেবাটি পরীক্ষা করা শুরু করে। বিনামূল্যে 10 মিলিয়ন টোকেন পেতে নিবন্ধন করুন। ইন্টারফেসটি OpenAI API ইন্টারফেসের সাথে সামঞ্জস্যপূর্ণ, এবং উভয় চ্যাট/কোডার দ্বৈত মডেল উপলব্ধ। এই সময়ে, DeepSeek প্রযুক্তি গবেষণা এবং উন্নয়ন ছাড়াও একটি প্রযুক্তি পরিষেবা প্রদানকারীর পথ অন্বেষণ করতে শুরু করে।
চালু ফেব্রুয়ারী 5, 2024, DeepSeek আরেকটি উল্লম্ব ডোমেন মডেল প্রকাশ করেছে, DeepSeekMath, একটি গাণিতিক যুক্তি মডেল। এই মডেলটিতে শুধুমাত্র 7B প্যারামিটার রয়েছে, তবে এর গাণিতিক যুক্তি ক্ষমতা GPT-4 এর কাছাকাছি। প্রামাণিক MATH বেঞ্চমার্ক তালিকায়, এটি ভিড়কে ছাড়িয়ে গেছে এবং 30B এবং 70B এর মধ্যে প্যারামিটার আকার সহ বেশ কয়েকটি ওপেন সোর্স মডেলকে ছাড়িয়ে গেছে। DeepSeekMath-এর রিলিজ সম্পূর্ণরূপে DeepSeek-এর প্রযুক্তিগত শক্তি এবং উল্লম্বের গবেষণা ও উন্নয়নে এবং মডেল গবেষণা ও উন্নয়নে এর অগ্রগামী লেআউটকে প্রদর্শন করে।
চালু ২৮শে ফেব্রুয়ারী, ২০২৪, DeepSeek ওপেন সোর্স মডেল ব্যবহার সম্পর্কে ডেভেলপারদের উদ্বেগ আরও কমাতে, DeepSeek একটি ওপেন সোর্স নীতি FAQ প্রকাশ করেছে।, যা প্রায়শই জিজ্ঞাসিত প্রশ্নের বিস্তারিত উত্তর প্রদান করে যেমন মডেল ওপেন সোর্স লাইসেন্সিং এবং বাণিজ্যিক ব্যবহারের বিধিনিষেধ। DeepSeek আরও স্বচ্ছ এবং উন্মুক্ত মনোভাবের সাথে ওপেন সোর্সকে আলিঙ্গন করে:
চালু মার্চ 11, 2024, DeepSeek মাল্টি-মডেল বড় মডেল DeepSeek-VL প্রকাশ করেছে. এটি মাল্টি-মডেল এআই প্রযুক্তিতে DeepSeek-এর প্রাথমিক প্রচেষ্টা। মডেলটি 7B এবং 1.3B আকারের, এবং মডেল এবং প্রযুক্তিগত কাগজপত্র একই সাথে ওপেন সোর্স করা হয়।
চালু 20 মার্চ, 2024, Huanfang AI & DeepSeek কে আবার NVIDIA GTC 2024 সম্মেলনে অংশগ্রহণের জন্য আমন্ত্রণ জানানো হয়েছিল এবং প্রতিষ্ঠাতা লিয়াং ওয়েনফেং একটি প্রযুক্তিগত মূল বক্তব্য প্রদান করেছিলেন শিরোনাম "বৈচিত্র্যের মধ্যে সম্প্রীতি: বৃহৎ ভাষার মডেলগুলির মানগুলিকে সারিবদ্ধকরণ এবং ডিকপলিং"। "একটি একক-মূল্যের বৃহৎ মডেল এবং বহুত্ববাদী সমাজ ও সংস্কৃতির মধ্যে দ্বন্দ্ব," "বৃহৎ মডেলের মান বিন্যাসের ডিকপলিং" এবং "ডিকপল্ড ভ্যালু অ্যালাইনমেন্টের বহুমাত্রিক চ্যালেঞ্জ" এর মতো বিষয়গুলি নিয়ে আলোচনা করা হয়েছিল৷ এটি প্রযুক্তিগত গবেষণা এবং উন্নয়ন ছাড়াও DeepSeek-এর মানবিক যত্ন এবং AI উন্নয়নের জন্য সামাজিক দায়বদ্ধতা প্রদর্শন করে।
2024 সালের মার্চ মাসে, DeepSeek API আনুষ্ঠানিকভাবে প্রদত্ত পরিষেবা চালু করেছে, যা চীনের বৃহৎ মডেল বাজারে মূল্য যুদ্ধের পূর্বসূচীকে সম্পূর্ণরূপে প্রজ্বলিত করেছে: প্রতি মিলিয়ন ইনপুট টোকেনে 1 ইউয়ান এবং প্রতি মিলিয়ন আউটপুট টোকেনে 2 ইউয়ান।
2024 সালে, DeepSeek সফলভাবে চীনে বৃহৎ মডেলের রেকর্ডাল পাস করেছে, এর API পরিষেবাগুলি সম্পূর্ণ খোলার জন্য নীতির বাধাগুলি সাফ করেছে।
2024 সালের মে মাসে, DeepSeek-V2, একটি ওপেন সোর্স জেনারেল MoE বৃহৎ মডেল, প্রকাশিত হয়েছিল, এবং প্রাইস যুদ্ধ আনুষ্ঠানিকভাবে শুরু হয়েছিল। DeepSeek-V2 এমএলএ (মাল্টি-হেড ল্যাটেন্ট অ্যাটেনশন মেকানিজম) ব্যবহার করে, যা মডেলের মেমরি পদচিহ্নকে 5%-13%-এ প্রথাগত MHA-এর থেকে কমিয়ে দেয়। একই সময়ে, এটি স্বাধীনভাবে DeepSeek MoE স্পার্স স্পারস স্ট্রাকচার তৈরি করেছে, যা মডেলের গণনাগত জটিলতাকে ব্যাপকভাবে হ্রাস করে। এর জন্য ধন্যবাদ, মডেলটি “1 ইউয়ান/মিলিয়ন ইনপুট এবং 2 ইউয়ান/মিলিয়ন আউটপুট” এর API মূল্য বজায় রাখে।
DeepSeek একটি বিশাল প্রভাব ফেলেছে। এই বিষয়ে, সেমিঅ্যানালাইসিসের প্রধান বিশ্লেষক বিশ্বাস করেন যে DeepSeek V2 পেপার "এই বছরের সেরা একটি হতে পারে।" একইভাবে, ওপেনএআইয়ের একজন প্রাক্তন কর্মচারী অ্যান্ড্রু কার বিশ্বাস করেন যে কাগজটি "আশ্চর্যজনক জ্ঞানে পূর্ণ" এবং এটির প্রশিক্ষণ সেটিংস তার নিজের মডেলে প্রয়োগ করেছে।
এটি লক্ষ করা উচিত যে এটি এমন একটি মডেল যা GPT-4-টার্বোকে বেঞ্চমার্ক করে এবং এপিআই মূল্য পরবর্তীটির মাত্র 1/70
জুনে ১৭ই ডিসেম্বর, ২০২৪ তারিখে, DeepSeek আবারও একটি বড় ধাক্কা খেয়ে DeepSeek কোডার V2 কোড মডেল প্রকাশ করে। ওপেন সোর্স এবং দাবি করে যে এর কোড ক্ষমতা GPT-4-টার্বোকে ছাড়িয়ে গেছে, যা সেই সময়ের সবচেয়ে উন্নত ক্লোজড-সোর্স মডেল। DeepSeek কোডার V2 DeepSeek-এর সামঞ্জস্যপূর্ণ ওপেন সোর্স কৌশল চালিয়ে যাচ্ছে, সমস্ত মডেল, কোড এবং কাগজপত্র ওপেন সোর্স সহ, এবং দুটি সংস্করণ, 236B এবং 16B প্রদান করা হয়েছে। DeepSeek C oder V2-এর API পরিষেবাগুলিও অনলাইনে উপলব্ধ, এবং মূল্য "1 ইউয়ান/মিলিয়ন ইনপুট এবং 2 ইউয়ান/মিলিয়ন আউটপুট" এ রয়ে গেছে।
চালু জুন 21, 2024, DeepSeek কোডার অনলাইন কোড এক্সিকিউশন সমর্থিত। একই দিনে, Claude3.5 সনেট নতুন আর্টিফ্যাক্ট বৈশিষ্ট্য সহ মুক্তি পায়, যা স্বয়ংক্রিয়ভাবে কোড তৈরি করে এবং সরাসরি ব্রাউজারে চালায়। একই দিনে, DeepSeek ওয়েবসাইটে কোড সহকারীও একই বৈশিষ্ট্য চালু করেছে: কোড জেনারেট করুন এবং এক ক্লিকে এটি চালান।
আসুন এই সময়ের প্রধান ঘটনাগুলি পর্যালোচনা করি:
ক্রমাগত সাফল্য, বিশ্ব মনোযোগ আকর্ষণ
2024 সালের মে মাসে, DeepSeek DeepSeek V2 প্রকাশ করে রাতারাতি বিখ্যাত হয়ে ওঠে, MoE ভিত্তিক একটি ওপেন সোর্স মডেল। এটি GPT-4-Turbo-এর কর্মক্ষমতার সাথে মিলেছে, কিন্তু মাত্র 1 ইউয়ান/মিলিয়ন ইনপুটের মূল্যে, যা GPT-4-Turbo-এর 1/70 ছিল৷ সেই সময়ে, DeepSeek শিল্পে একটি সুপরিচিত "মূল্য কসাই" হয়ে ওঠে, এবং তারপর মূলধারার খেলোয়াড় যেমন ঝিচেং, বাইটড্যান্স, এবং আলিবাবা... এবং অন্যান্য প্রধান খেলোয়াড়রা দ্রুত তা অনুসরণ করে এবং তাদের দাম কমিয়ে দেয়। সেই সময়েও জিপিটি নিষেধাজ্ঞার আরেকটি রাউন্ড ছিল, এবং বিপুল সংখ্যক এআই অ্যাপ্লিকেশন প্রথমবারের মতো ঘরোয়া মডেলগুলি চেষ্টা করতে শুরু করেছিল।
জুলাই 2024 সালে, DeepSeek এর প্রতিষ্ঠাতা লিয়াং ওয়েনফেং আবার ডার্ক সার্জের সাথে একটি সাক্ষাত্কার গ্রহণ করেছিলেন এবং মূল্য যুদ্ধে সরাসরি প্রতিক্রিয়া জানিয়েছিলেন: “খুব অপ্রত্যাশিত। আমি আশা করিনি যে দাম সবাইকে এতটা সংবেদনশীল করে তুলবে। আমরা শুধু আমাদের নিজস্ব গতিতে জিনিস করি এবং তারপর খরচের উপর ভিত্তি করে দাম করি। আমাদের নীতি অর্থ হারানো বা অত্যধিক লাভ করা নয়। সামান্য লাভের সাথে এই দামটিও খরচের একটু বেশি।”
এটি দেখা যায় যে, অনেক প্রতিযোগীর বিপরীতে যারা ভর্তুকি দেওয়ার জন্য তাদের নিজস্ব পকেট থেকে অর্থ প্রদান করে, DeepSeek এই মূল্যে লাভজনক।
কিছু লোক বলতে পারে: মূল্য হ্রাস ব্যবহারকারীদের ছিনতাই করার মতো, এবং এটি সাধারণত ইন্টারনেট যুগে মূল্য যুদ্ধের ক্ষেত্রে হয়
জবাবে, লিয়াং ওয়েনফেংও প্রতিক্রিয়া জানিয়েছেন: “ব্যবহারকারীদের ছিনতাই করা আমাদের মূল লক্ষ্য নয়। আমরা দাম কমিয়েছি কারণ, একদিকে, আমরা পরবর্তী প্রজন্মের মডেলের কাঠামো অন্বেষণ করার সাথে সাথে খরচ কমে গেছে, এবং অন্যদিকে, আমরা মনে করি যে API এবং AI উভয়ই সাশ্রয়ী এবং সকলের কাছে অ্যাক্সেসযোগ্য হওয়া উচিত। "
তাই লিয়াং ওয়েনফেং এর আদর্শবাদের সাথে গল্পটি চলতে থাকে।
4 জুলাই, 2024-এ, DeepSeek API অনলাইন হয়ে গেছে। 128K প্রসঙ্গের দাম অপরিবর্তিত রয়েছে। একটি মডেলের অনুমান খরচ প্রসঙ্গটির দৈর্ঘ্যের সাথে ঘনিষ্ঠভাবে সম্পর্কিত। অতএব, অনেক মডেলের এই দৈর্ঘ্যের উপর কঠোর নিষেধাজ্ঞা রয়েছে: GPT-3.5-এর প্রাথমিক সংস্করণে শুধুমাত্র 4k প্রসঙ্গ রয়েছে।
এই সময়ে, DeepSeek মূল্য অপরিবর্তিত রেখে পূর্ববর্তী 32k থেকে প্রসঙ্গ দৈর্ঘ্য বাড়িয়ে 128k করেছে (প্রতি মিলিয়ন ইনপুট টোকেনে 1 ইউয়ান এবং প্রতি মিলিয়ন আউটপুট টোকেনে 2 ইউয়ান)।
চালু ১০ জুলাই, ২০২৪, বিশ্বের প্রথম এআই অলিম্পিয়াড (AIMO)-এর ফলাফল ঘোষণা করা হয় এবং DeepSeekMath মডেলটি শীর্ষ দলগুলির সাধারণ পছন্দ হয়ে ওঠে।. বিজয়ী শীর্ষ 4 টি দল তাদের প্রবেশ মডেলের ভিত্তি হিসাবে DeepSeekMath-7B বেছে নিয়েছে এবং প্রতিযোগিতায় চিত্তাকর্ষক ফলাফল অর্জন করেছে।
চালু জুলাই 18, 2024, DeepSeek-V2 চ্যাটবট এরেনায় ওপেন সোর্স মডেলের তালিকায় শীর্ষে ছিল, Llama3-70B, Qwen2-72B, Nemotron-4-340B, এবং Gemma2-27B এর মতো তারকা মডেলগুলিকে ছাড়িয়ে যাচ্ছে এবং ওপেন সোর্স বড় মডেলগুলির জন্য একটি নতুন মানদণ্ড হয়ে উঠছে৷
ইন জুলাই 2024, DeepSeek প্রতিভা নিয়োগ অব্যাহত রেখেছে এবং ভবিষ্যতের প্রযুক্তিগত উদ্ভাবন এবং পণ্য বিকাশের জন্য প্রস্তুত করার জন্য AI অ্যালগরিদম, এআই ইনফ্রা, এআই টিউটর এবং এআই পণ্য সহ একাধিক ক্ষেত্রে বিশ্বজুড়ে শীর্ষ প্রতিভা নিয়োগ করেছে।
চালু জুলাই 26, 2024, DeepSeek API একটি গুরুত্বপূর্ণ আপগ্রেডের সূচনা করেছে, যা ওভাররাইটিং, FIM (ফিল-ইন-দ্য-মিডল) সমাপ্তি, ফাংশন কলিং এবং JSON আউটপুটের মতো উন্নত বৈশিষ্ট্যগুলির একটি সিরিজকে সম্পূর্ণরূপে সমর্থন করে। এফআইএম ফাংশনটি খুব আকর্ষণীয়: ব্যবহারকারী শুরু এবং শেষ দেয় এবং বড় মডেলটি মাঝখানে পূরণ করে, যা সঠিক ফাংশন কোডটি পূরণ করার জন্য প্রোগ্রামিং প্রক্রিয়ার জন্য খুব উপযুক্ত। একটি উদাহরণ হিসাবে ফিবোনাচি ক্রম লেখা নিন:
চালু আগস্ট 2, 2024, DeepSeek উদ্ভাবনীভাবে হার্ড ডিস্ক ক্যাশিং প্রযুক্তি চালু করেছে, API এর দাম গোড়ালি পর্যন্ত কমিয়ে দিয়েছে। পূর্বে, এপিআই মূল্য ছিল প্রতি মিলিয়ন টোকেনে শুধুমাত্র £1। এখন, যাইহোক, একবার ক্যাশে হিট হয়ে গেলে, API ফি সরাসরি ¥0.1 এ নেমে যায়।
ক্রমাগত কথোপকথন এবং ব্যাচ প্রক্রিয়াকরণের কাজগুলি জড়িত থাকলে এই বৈশিষ্ট্যটি খুব বাস্তব।
চালু আগস্ট 16, 2024, DeepSeek তার গাণিতিক উপপাদ্য প্রকাশ করেছে যা প্রমাণ করে মডেল DeepSeek-প্রোভার-V1.5 ওপেন সোর্স হিসেবে, যা হাই স্কুল এবং কলেজের গাণিতিক উপপাদ্য প্রমাণকারী পরীক্ষায় অনেক সুপরিচিত ওপেন সোর্স মডেলকে ছাড়িয়ে গেছে।
চালু সেপ্টেম্বর 6, 2024, DeepSeek DeepSeek-V2.5 ফিউশন মডেল প্রকাশ করেছে। পূর্বে, DeepSeek প্রধানত দুটি মডেল সরবরাহ করেছিল: চ্যাট মডেলটি সাধারণ কথোপকথনের দক্ষতার উপর দৃষ্টি নিবদ্ধ করেছিল এবং কোড মডেলটি কোড প্রক্রিয়াকরণ দক্ষতার উপর দৃষ্টি নিবদ্ধ করেছিল। এইবার, দুটি মডেলকে একত্রিত করা হয়েছে, DeepSeek-V2.5-এ আপগ্রেড করা হয়েছে, যা মানুষের পছন্দের সাথে আরও ভালভাবে সারিবদ্ধ হয়েছে এবং লেখার কাজ, কমান্ড অনুসরণ এবং অন্যান্য দিকগুলিতেও উল্লেখযোগ্য উন্নতি করেছে।
চালু 18 সেপ্টেম্বর, 2024, DeepSeek-V2.5 আবারও সর্বশেষ LMSYS তালিকায় ছিল, যা দেশীয় মডেলগুলির মধ্যে নেতৃত্ব দেয় এবং একাধিক স্বতন্ত্র ক্ষমতায় দেশীয় মডেলের জন্য নতুন সেরা স্কোর সেট করা।
চালু নভেম্বর 20, 2024, DeepSeek DeepSeek-R1-Lite প্রকাশ করেছে অফিসিয়াল ওয়েবসাইটে। এটি একটি অনুমান মডেল যা o1-প্রিভিউয়ের সাথে তুলনীয়, এবং এটি V3-এর পোস্ট-প্রশিক্ষণের জন্য পর্যাপ্ত পরিমাণে সিন্থেটিক ডেটা সরবরাহ করে।
চালু ১০ ডিসেম্বর, ২০২৪ তারিখে, DeepSeek V2 সিরিজটি DeepSeek-V2.5-1210 এর চূড়ান্ত সূক্ষ্ম-সুরক্ষিত সংস্করণ প্রকাশের মাধ্যমে তার সমাপ্তিতে সূচনা করে। এই সংস্করণটি ব্যাপকভাবে গণিত, কোডিং, লেখা এবং প্রশিক্ষণ পরবর্তী ভূমিকা সহ একাধিক দক্ষতা উন্নত করে।
এই সংস্করণের আগমনের সাথে, DeepSeek ওয়েব অ্যাপটি নেটওয়ার্ক অনুসন্ধান ফাংশনও খুলেছে।
চালু ডিসেম্বর 13, 2024, DeepSeek মাল্টিমোডালিটির ক্ষেত্রে আরেকটি অগ্রগতি করেছে এবং ওপেন সোর্স মাল্টিমোডাল বড় মডেল DeepSeek-VL2 প্রকাশ করেছে। DeepSeek-VL2 MoE আর্কিটেকচার গ্রহণ করে, যা এর চাক্ষুষ ক্ষমতাকে উল্লেখযোগ্যভাবে উন্নত করে। এটি তিনটি আকারে উপলব্ধ: 3B, 16B, এবং 27B, এবং সমস্ত মেট্রিক্সে একটি সুবিধা রয়েছে৷
চালু ডিসেম্বর 26, 2024, DeepSeek-V3 ওপেন সোর্স সহ প্রকাশিত হয়েছিল: প্রশিক্ষণের আনুমানিক খরচ ছিল মাত্র 5.5 মিলিয়ন মার্কিন ডলার। DeepSeek-V3 সম্পূর্ণরূপে বিদেশী নেতৃস্থানীয় ক্লোজড সোর্স মডেলের কর্মক্ষমতা বেঞ্চমার্ক করেছে এবং প্রজন্মের গতিকে ব্যাপকভাবে উন্নত করেছে।
API পরিষেবাগুলির মূল্য সমন্বয় করা হয়েছিল, কিন্তু একই সময়ে, নতুন মডেলের জন্য একটি 45-দিনের অগ্রাধিকারমূলক ট্রায়াল সময়কাল সেট করা হয়েছিল।
15 জানুয়ারী, 2025-এ, অফিসিয়াল DeepSeek অ্যাপটি আনুষ্ঠানিকভাবে প্রকাশ করা হয়েছিল এবং প্রধান iOS/Android অ্যাপ বাজারে সম্পূর্ণরূপে চালু হয়েছিল।
20 জানুয়ারী, 2025-এ, চীনা নববর্ষের কাছাকাছি, DeepSeek-R1 অনুমান মডেলটি আনুষ্ঠানিকভাবে প্রকাশ করা হয়েছিল এবং মুক্ত-সোর্স করা হয়েছিল। DeepSeek-R1 অফিসিয়াল OpenAI o1 রিলিজের সাথে তার কর্মক্ষমতা সম্পূর্ণভাবে সারিবদ্ধ করেছে এবং চিন্তা চেইন আউটপুট ফাংশন খুলেছে। একই সময়ে, DeepSeek এও ঘোষণা করেছে যে মডেল ওপেন সোর্স লাইসেন্সটিকে MIT লাইসেন্সে পরিবর্তন করা হবে এবং ব্যবহারকারী চুক্তিটি স্পষ্টভাবে "মডেল ডিস্টিলেশন" এর অনুমতি দেবে, আরও ওপেন সোর্সকে আলিঙ্গন করবে এবং প্রযুক্তি ভাগাভাগি প্রচার করবে।
পরে, এই মডেলটি খুব জনপ্রিয় হয়ে ওঠে এবং একটি নতুন যুগের সূচনা করে
ফলস্বরূপ, 27 জানুয়ারী, 2025 পর্যন্ত, DeepSeek অ্যাপ সফলভাবে ChatGPT-কে ছাড়িয়ে গেছে এবং US iOS অ্যাপ স্টোরে বিনামূল্যে অ্যাপ ডাউনলোডের তালিকায় শীর্ষে রয়েছে, যা একটি অসাধারণ AI অ্যাপ হয়ে উঠেছে।
27 জানুয়ারী, 2025-এ, নববর্ষের প্রাক্কালে সকাল 1:00 এ, DeepSeek Janus-Pro ওপেন সোর্স হিসাবে প্রকাশিত হয়েছিল। এটি একটি বহুমুখী মডেল যা প্রাচীন রোমান পৌরাণিক কাহিনীতে দুই মুখের দেবতা জানুসের নামানুসারে নামকরণ করা হয়েছে: এটি অতীত এবং ভবিষ্যত উভয়ের মুখোমুখি। এটি মডেলের দুটি ক্ষমতা-ভিজ্যুয়াল বোঝাপড়া এবং ইমেজ জেনারেশন-এবং একাধিক র্যাঙ্কিংয়ের আধিপত্যকেও প্রতিনিধিত্ব করে।
DeepSeek-এর বিস্ফোরক জনপ্রিয়তা অবিলম্বে একটি বিশ্বব্যাপী প্রযুক্তির শকওয়েভের সূত্রপাত করে, এমনকি সরাসরি NVIDIA-এর স্টক মূল্য 18%-এ নেমে আসে এবং বিশ্ব প্রযুক্তি স্টক মার্কেটের বাজার মূল্য প্রায় 1 ট্রিলিয়ন মার্কিন ডলার বাষ্পীভূত হয়। ওয়াল স্ট্রিট এবং প্রযুক্তি মিডিয়া বলেছে যে DeepSeek এর উত্থান বিশ্বব্যাপী AI শিল্পের ল্যান্ডস্কেপকে বিপর্যস্ত করছে এবং আমেরিকান প্রযুক্তি জায়ান্টদের কাছে একটি অভূতপূর্ব চ্যালেঞ্জ তৈরি করছে।
DeepSeek-এর সাফল্য উচ্চ আন্তর্জাতিক মনোযোগ এবং চীনের AI প্রযুক্তিগত উদ্ভাবন ক্ষমতা সম্পর্কে উত্তপ্ত আলোচনার সূত্রপাত করেছে। মার্কিন প্রেসিডেন্ট ডোনাল্ড ট্রাম্প, একটি বিরল জনসাধারণের মন্তব্যে, DeepSeek-এর উত্থানকে "ইতিবাচক" হিসাবে প্রশংসা করেছেন এবং বলেছিলেন যে এটি মার্কিন যুক্তরাষ্ট্রের জন্য একটি "জাগরণ কল"। মাইক্রোসফ্ট সিইও সত্য নাদেলা এবং ওপেনএআই সিইও স্যাম অল্টম্যানও DeepSeek এর প্রশংসা করেছেন, এর প্রযুক্তিকে "খুবই চিত্তাকর্ষক" বলেছেন।
অবশ্যই, আমাদের অবশ্যই বুঝতে হবে যে তাদের প্রশংসা আংশিকভাবে DeepSeek এর শক্তির স্বীকৃতি এবং আংশিকভাবে তাদের নিজস্ব উদ্দেশ্যের প্রতিফলন। উদাহরণস্বরূপ, যখন অ্যানথ্রপিক DeepSeek-এর কৃতিত্বকে স্বীকৃতি দেয়, তখন এটি মার্কিন সরকারকে চীনের উপর চিপ নিয়ন্ত্রণ জোরদার করার জন্যও আহ্বান জানায়।
নৃতাত্ত্বিক সিইও একটি 10,000-শব্দের নিবন্ধ প্রকাশ করেছেন: DeepSeek এর উত্থানের অর্থ হোয়াইট হাউসের নিয়ন্ত্রণ বাড়াতে হবে
সারাংশ এবং দৃষ্টিভঙ্গি
DeepSeek এর বিগত দুই বছরের দিকে ফিরে তাকালে, এটি সত্যিই একটি "চীনা অলৌকিক" হয়েছে: একটি অজানা স্টার্টআপ থেকে "রহস্যময় পূর্ব শক্তি" যা এখন বিশ্বব্যাপী AI মঞ্চে জ্বলজ্বল করছে, DeepSeek তার সাথে একের পর এক "অসম্ভব" লিখেছে। শক্তি এবং উদ্ভাবন।
এই প্রযুক্তিগত অভিযানের গভীর অর্থ অনেক আগেই বাণিজ্যিক প্রতিযোগিতার পরিধি অতিক্রম করেছে। DeepSeek তথ্য সহ ঘোষণা করেছে যে কৃত্রিম বুদ্ধিমত্তার কৌশলগত ক্ষেত্রে যা ভবিষ্যতের জন্য উদ্বিগ্ন, চীনা কোম্পানিগুলি মূল প্রযুক্তির উচ্চতায় আরোহণ করতে সম্পূর্ণরূপে সক্ষম।
ট্রাম্পের বাজানো "শঙ্কা ঘণ্টা" এবং অ্যানথ্রোপিকের লুকানো ভয় চীনের এআই ক্ষমতার গুরুত্বকে সুনির্দিষ্টভাবে নিশ্চিত করে: এটি কেবল তরঙ্গে চড়তে পারে না, তবে এটি জোয়ারের দিকটিকেও নতুন আকার দিচ্ছে
গভীর অনুসন্ধান পণ্য মুক্তি মাইলফলক
- নভেম্বর 2, 2023: DeepSeek কোডার বড় মডেল
- নভেম্বর 29, 2023: DeepSeek LLM 67B ইউনিভার্সাল মডেল
- ডিসেম্বর 18, 2023: DreamCraft3D 3D মডেল
- জানুয়ারী 11, 2024: DeepSeekMoE MoE বড় মডেল
- ফেব্রুয়ারি 5, 2024: DeepSeekMath গাণিতিক যুক্তি মডেল
- মার্চ 11, 2024: DeepSeek-VL মাল্টিমোডাল বড় মডেল
- মে 2024: DeepSeek-V2 MoE সাধারণ মডেল
- জুন 17, 2024: DeepSeek কোডার V2 কোড মডেল
- সেপ্টেম্বর 6, 2024: DeepSeek-V2.5 সাধারণ এবং কোড দক্ষতা মডেলের ফিউশন
- 13 ডিসেম্বর, 2024: DeepSeek-VL2 মাল্টিমোডাল MoE মডেল
- ডিসেম্বর 26, 2024: DeepSeek-V3 সাধারণ-উদ্দেশ্য বড় মডেলের নতুন সিরিজ
- জানুয়ারী 20, 2025: DeepSeek-R1 অনুমান মডেল
- জানুয়ারী 20, 2025: DeepSeek অফিসিয়াল অ্যাপ (iOS এবং Android)
- জানুয়ারী 27, 2025: DeepSeek জানুস-প্রো মাল্টিমোডাল মডেল