ओपनएआई के नए जारी किए गए o3-mini और DeepSeek R1 की व्यापक तुलना

ओपनएआई ने अपना नवीनतम अनुमान मॉडल जारी किया है। o3-मिनी, जो विज्ञान, गणित और प्रोग्रामिंग जैसे क्षेत्रों के लिए अनुकूलित है, और तीव्र प्रतिक्रिया, उच्च सटीकता और कम लागत प्रदान करता है।

अपने पूर्ववर्ती o1-mini की तुलना में, o3-mini ने अपनी अनुमान क्षमताओं में उल्लेखनीय सुधार किया है, विशेष रूप से जटिल समस्याओं को हल करने में। परीक्षक o3-mini के उत्तरों को 56% से अधिक पसंद करते हैं, और त्रुटि दर 39% से कम हो गई है। आज से, चैटजीपीटी प्लस, टीम और प्रो उपयोगकर्ता o3-mini का उपयोग कर सकते हैं, और निःशुल्क उपयोगकर्ता आप भी इसकी कुछ विशेषताओं का अनुभव कर सकते हैं।

अनुमान मॉडल के साथ तुलना 1टीपी8टी-आर1, बस कितना बेहतर है ओपनएआई o3-मिनी R1 से अधिक?

यह लेख सबसे पहले o3-mini की मुख्य विशेषताओं का अवलोकन देगा, और फिर हम प्रत्येक बेंचमार्क पर दोनों पक्षों से डेटा निकालेंगे और उनकी तुलना करने के लिए एक ग्राफ़ बनाएंगे। इसके अलावा, हम o3-mini की कीमत की भी तुलना करेंगे।

विषयसूची

मुख्य विशेषताएं

1.STEM अनुकूलन: गणित, प्रोग्रामिंग, विज्ञान आदि के क्षेत्रों में उत्कृष्टता प्राप्त करता है, विशेष रूप से उच्च अनुमान प्रयास मोड में o1-mini से आगे निकल जाता है।

2.डेवलपर फ़ंक्शन: उत्पादन वातावरण की आवश्यकताओं को पूरा करने के लिए फ़ंक्शन कॉल, संरचित आउटपुट और डेवलपर संदेश जैसे कार्यों का समर्थन करता है।

3.तीव्र प्रतिक्रिया: o1-mini की तुलना में 24% अधिक तेज़, प्रति अनुरोध 7.7 सेकंड का प्रतिक्रिया समय।

4.सुरक्षा सुधार: गहन संरेखण प्रौद्योगिकी के माध्यम से सुरक्षित और विश्वसनीय आउटपुट सुनिश्चित करता है।

5.प्रभावी लागतअनुमान क्षमताएं और लागत अनुकूलन एक साथ चलते हैं, जिससे एआई के उपयोग की सीमा बहुत कम हो जाती है।

तुलना करना

ओपन एआई अपनी श्रेणी को उजागर करने के लिए, आधिकारिक ब्लॉग केवल अपने स्वयं के मॉडल के साथ इसकी तुलना करता है। इसलिए, यह लेख DeepSeek R1 पेपर और आधिकारिक OpenAI ब्लॉग के डेटा से निकाली गई एक तालिका है।

ओपनएआई ने आधिकारिक तौर पर तुलना की o3-मिनी संस्करण सूची में, इसे तीन संस्करणों में विभाजित किया गया है: कम, मध्यम और उच्च, जो अनुमान की ताकत को इंगित करते हैं। चूंकि DeepSeek मैथ-500 का उपयोग करता है और ओपनएआई मैथ डेटासेट का उपयोग करता है, इसलिए यह तुलना यहाँ हटा दी गई है।

चार्ट ज़्यादा सहज है, और कोडफोर्स को हटा दिया गया है क्योंकि मान सहज रूप से प्रदर्शित करने के लिए बहुत बड़े हैं। हालाँकि, कोडफोर्स पर तुलना से पता चलता है कि o3-mini की उच्च अनुमान शक्ति बहुत ज़्यादा बढ़त नहीं है।

↑1AIME2024→2GPQA डायमंड→3MMLU→4SWE-बेंच-सत्यापित

चार्ट से कुल 4 तुलनाएं मिलती हैं, और O3-मिनी (उच्च) आम तौर पर आगे है, लेकिन बढ़त बहुत छोटी है।

कीमत

नमूना	इनपुट मूल्य	कैश हिट	आउटपुट मूल्य
o3-मिनी	$1.10	$0.55	$4.40
ओ1	$15.00	$7.50	$60.00
डीपसीक आर1	$0.55	$0.14	$2.19

सारांश

DeepSeek R1 के कारण संयुक्त राज्य अमेरिका में DeepSeek की दहशत फैल जाने के बाद, सबसे पहले OpenAI को ही खतरा महसूस हुआ, जो विशेष रूप से इसके नए मॉडल o3-mini के मूल्य निर्धारण से स्पष्ट है।

जब ओपेनाई ओ1 पहली बार रिलीज़ हुआ था, तो इसकी उच्च कीमत ने कई डेवलपर्स और उपयोगकर्ताओं पर दबाव डाला था। DeepSeek R1 की उपस्थिति ने सभी को अधिक विकल्प दिए।o1 और R1 के बीच 30 गुना मूल्य अंतर से लेकर o3-मिनी की अंतिम कीमत दोगुनी होने तक DeepSeek R1 की कीमत,

ओपनएआई पर DeepSeek R1 के प्रभाव को दर्शाता है।हालाँकि, चैटजीपीटी के मुफ्त उपयोगकर्ता केवल सीमित तरीके से ही o3-mini का अनुभव कर सकते हैं, जबकि DeepSeek की डीप थिंकिंग वर्तमान में सभी उपयोगकर्ताओं के लिए उपलब्ध है।मैं यह भी आशा करता हूं कि ओपनएआई उपयोगकर्ताओं के लिए उपयोग की लागत को कम करते हुए और अधिक अग्रणी एआई मॉडल लाएगा।

R1 का उपयोग करने वाले एक ब्लॉगर के व्यक्तिगत अनुभव के दृष्टिकोण से, मैं कहना चाहूँगा कि R1 की डीप थिंकिंग हमेशा मेरे दिमाग को खोलती है। मैं सुझाव देता हूँ कि हर कोई समस्याओं के बारे में सोचने के लिए इसका अधिक उपयोग करे~

अवर्गीकृत

एआई सर्कल में, DeepSeek R1 ने शारीरिक परीक्षणों में o1 और क्लाउड को लगातार पीछे छोड़ दिया है, और हम आरएल के स्वर्ण युग में प्रवेश कर चुके हैं।

द्वाराzddeepseeker 1 फरवरी, 20251 फरवरी, 2025

हममें से किसी ने भी नहीं सोचा था कि AI क्षेत्र में 2025 की शुरुआत इस तरह होगी। DeepSeek R1 वाकई अद्भुत है! हाल ही में, "रहस्यमयी पूर्वी शक्ति" DeepSeek सिलिकॉन वैली को "कठोर रूप से नियंत्रित" कर रही है। मैंने R1 से पाइथागोरस प्रमेय को विस्तार से समझाने के लिए कहा। यह सब AI द्वारा 30 सेकंड से भी कम समय में बिना किसी…

अवर्गीकृत

ऑल्टमैन: हम ओपन सोर्स AI के बारे में गलत थे! DeepSeek ने ओपनAI को कम लाभकारी बना दिया है, और अगला GPT-5 है

द्वाराzddeepseeker 1 फरवरी, 20251 फरवरी, 2025

o3-mini देर रात को आया, और OpenAI ने आखिरकार अपना नवीनतम ट्रम्प कार्ड दिखाया। Reddit AMA Q&A के दौरान, Altman ने गहराई से कबूल किया कि वह ओपन सोर्स AI के गलत पक्ष पर खड़ा था। उन्होंने कहा कि ओपन सोर्स की आंतरिक रणनीति पर विचार किया जा रहा है, और मॉडल का विकास जारी रहेगा, लेकिन…

अवर्गीकृत

ओपनएआई o3-मिनी बनाम DeepSeek-R1: नई पीढ़ी के एआई मॉडल का राजा कौन है?

द्वाराzddeepseeker 1 फरवरी, 20251 फरवरी, 2025

o3-mini एक चुनौती की गति के साथ यहाँ है 31 जनवरी को, OpenAI ने बिल्कुल नया o3-mini बड़ा मॉडल जारी किया और सभी ChatGPT उपयोगकर्ताओं को इसके कुछ फ़ंक्शन मुफ़्त में उपलब्ध कराए। हालाँकि क्वेरीज़ की संख्या पर एक सीमा है, लेकिन यह उपयोगकर्ताओं को जल्द से जल्द OpenAI के नवीनतम वाणिज्यिक मॉडल का अनुभव करने की अनुमति देता है…

अवर्गीकृत

27 वर्षीय सीईओ के साथ a16z संवाद: AI एजेंट का बहुत बड़ा उत्तोलन प्रभाव है, और दीर्घकालिक मूल्य निर्धारण श्रम लागत से जुड़ा होगा

द्वाराzddeepseeker 8 फरवरी, 20258 फरवरी, 2025

हाइलाइट्स एआई एजेंट ग्राहक अनुभव को नया आकार देता है जेसी झांग: एजेंट वास्तव में कैसे बनाया जाता है? हमारा विचार है कि समय के साथ, यह अधिक से अधिक प्राकृतिक भाषा-आधारित एजेंट की तरह बन जाएगा क्योंकि इसी तरह बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित किया जाता है। लंबे समय में, यदि आपके पास एक सुपर इंटेलिजेंट एजेंट है जो…

अवर्गीकृत

DeepSeek 1 के पीछे का रहस्य | DeepSeekMath और GRPO विवरण

द्वाराzddeepseeker फरवरी 9, 2025फरवरी 9, 2025

आज मैं DeepSeek से एक लेख साझा करना चाहूँगा, जिसका शीर्षक है DeepSeekMath: ओपन लैंग्वेज मॉडल में गणितीय तर्क की सीमाओं को आगे बढ़ाना। यह लेख DeepSeekMath 7B का परिचय देता है, जो 120B गणित-संबंधित टोकन, प्राकृतिक भाषा और कोड डेटा के संग्रह के आधार पर DeepSeek-Coder-Base-v1.5 7B पर पूर्व-प्रशिक्षित है। मॉडल ने प्रतिस्पर्धी-स्तर में 51.7% का आश्चर्यजनक स्कोर हासिल किया…

अवर्गीकृत

शीर्ष चार मॉडलों का मुक़ाबला! एक समीक्षा से पता चलता है कि डीपसीक आर1 कितना शक्तिशाली है

द्वाराzddeepseeker 1 जून, 20251 जून, 2025

पिछले कुछ दिनों में, डीपसीक-आर1 0528 को आधिकारिक तौर पर ओपन-सोर्स किया गया है। लाइवकोडबेंच पर, इसका प्रदर्शन ओपनएआई के ओ3 (उच्च) के बराबर है; एडर के बहुभाषी बेंचमार्क परीक्षण में, यह क्लाउड ओपस के मुकाबले अपनी स्थिति बनाए रखता है। जब इसे आधिकारिक वेबसाइट पर लॉन्च किया गया, तो हमने जल्दी से इसकी फ्रंट-एंड क्षमताओं का परीक्षण किया और पाया कि वे असाधारण रूप से…

मुख्य विशेषताएं

तुलना करना

कीमत

सारांश

इसी तरह की पोस्ट

प्रातिक्रिया दे जवाब रद्द करें