ओपनएआई ने अपना नवीनतम अनुमान मॉडल जारी किया है। o3-मिनी, जो विज्ञान, गणित और प्रोग्रामिंग जैसे क्षेत्रों के लिए अनुकूलित है, और तीव्र प्रतिक्रिया, उच्च सटीकता और कम लागत प्रदान करता है।

अपने पूर्ववर्ती o1-mini की तुलना में, o3-mini ने अपनी अनुमान क्षमताओं में उल्लेखनीय सुधार किया है, विशेष रूप से जटिल समस्याओं को हल करने में। परीक्षक o3-mini के उत्तरों को 56% से अधिक पसंद करते हैं, और त्रुटि दर 39% से कम हो गई है। आज से, चैटजीपीटी प्लस, टीम और प्रो उपयोगकर्ता o3-mini का उपयोग कर सकते हैं, और निःशुल्क उपयोगकर्ता आप भी इसकी कुछ विशेषताओं का अनुभव कर सकते हैं।

अनुमान मॉडल के साथ तुलना 1टीपी8टी-आर1, बस कितना बेहतर है ओपनएआई o3-मिनी R1 से अधिक?

यह लेख सबसे पहले o3-mini की मुख्य विशेषताओं का अवलोकन देगा, और फिर हम प्रत्येक बेंचमार्क पर दोनों पक्षों से डेटा निकालेंगे और उनकी तुलना करने के लिए एक ग्राफ़ बनाएंगे। इसके अलावा, हम o3-mini की कीमत की भी तुलना करेंगे।

मुख्य विशेषताएं

1.STEM अनुकूलन: गणित, प्रोग्रामिंग, विज्ञान आदि के क्षेत्रों में उत्कृष्टता प्राप्त करता है, विशेष रूप से उच्च अनुमान प्रयास मोड में o1-mini से आगे निकल जाता है।

2.डेवलपर फ़ंक्शन: उत्पादन वातावरण की आवश्यकताओं को पूरा करने के लिए फ़ंक्शन कॉल, संरचित आउटपुट और डेवलपर संदेश जैसे कार्यों का समर्थन करता है।

3.तीव्र प्रतिक्रिया: o1-mini की तुलना में 24% अधिक तेज़, प्रति अनुरोध 7.7 सेकंड का प्रतिक्रिया समय।

4.सुरक्षा सुधार: गहन संरेखण प्रौद्योगिकी के माध्यम से सुरक्षित और विश्वसनीय आउटपुट सुनिश्चित करता है।

5.प्रभावी लागतअनुमान क्षमताएं और लागत अनुकूलन एक साथ चलते हैं, जिससे एआई के उपयोग की सीमा बहुत कम हो जाती है।

तुलना करना

ओपन एआई अपनी श्रेणी को उजागर करने के लिए, आधिकारिक ब्लॉग केवल अपने स्वयं के मॉडल के साथ इसकी तुलना करता है। इसलिए, यह लेख DeepSeek R1 पेपर और आधिकारिक OpenAI ब्लॉग के डेटा से निकाली गई एक तालिका है।

ओपनएआई ने आधिकारिक तौर पर तुलना की o3-मिनी संस्करण सूची में, इसे तीन संस्करणों में विभाजित किया गया है: कम, मध्यम और उच्च, जो अनुमान की ताकत को इंगित करते हैं। चूंकि DeepSeek मैथ-500 का उपयोग करता है और ओपनएआई मैथ डेटासेट का उपयोग करता है, इसलिए यह तुलना यहाँ हटा दी गई है।

चार्ट ज़्यादा सहज है, और कोडफोर्स को हटा दिया गया है क्योंकि मान सहज रूप से प्रदर्शित करने के लिए बहुत बड़े हैं। हालाँकि, कोडफोर्स पर तुलना से पता चलता है कि o3-mini की उच्च अनुमान शक्ति बहुत ज़्यादा बढ़त नहीं है।

↑1AIME2024→2GPQA डायमंड→3MMLU→4SWE-बेंच-सत्यापित

चार्ट से कुल 4 तुलनाएं मिलती हैं, और O3-मिनी (उच्च) आम तौर पर आगे है, लेकिन बढ़त बहुत छोटी है।

कीमत

नमूनाइनपुट मूल्यकैश हिटआउटपुट मूल्य
o3-मिनी$1.10$0.55$4.40
ओ1$15.00$7.50$60.00
डीपसीक आर1$0.55$0.14$2.19

सारांश

DeepSeek R1 के कारण संयुक्त राज्य अमेरिका में DeepSeek की दहशत फैल जाने के बाद, सबसे पहले OpenAI को ही खतरा महसूस हुआ, जो विशेष रूप से इसके नए मॉडल o3-mini के मूल्य निर्धारण से स्पष्ट है।

जब ओपेनाई ओ1 पहली बार रिलीज़ हुआ था, तो इसकी उच्च कीमत ने कई डेवलपर्स और उपयोगकर्ताओं पर दबाव डाला था। DeepSeek R1 की उपस्थिति ने सभी को अधिक विकल्प दिए।o1 और R1 के बीच 30 गुना मूल्य अंतर से लेकर o3-मिनी की अंतिम कीमत दोगुनी होने तक DeepSeek R1 की कीमत,

ओपनएआई पर DeepSeek R1 के प्रभाव को दर्शाता है।हालाँकि, चैटजीपीटी के मुफ्त उपयोगकर्ता केवल सीमित तरीके से ही o3-mini का अनुभव कर सकते हैं, जबकि DeepSeek की डीप थिंकिंग वर्तमान में सभी उपयोगकर्ताओं के लिए उपलब्ध है।मैं यह भी आशा करता हूं कि ओपनएआई उपयोगकर्ताओं के लिए उपयोग की लागत को कम करते हुए और अधिक अग्रणी एआई मॉडल लाएगा।

R1 का उपयोग करने वाले एक ब्लॉगर के व्यक्तिगत अनुभव के दृष्टिकोण से, मैं कहना चाहूँगा कि R1 की डीप थिंकिंग हमेशा मेरे दिमाग को खोलती है। मैं सुझाव देता हूँ कि हर कोई समस्याओं के बारे में सोचने के लिए इसका अधिक उपयोग करे~

इसी तरह की पोस्ट

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *