ओपनएआईले आफ्नो पछिल्लो इन्फरेन्स मोडेल जारी गरेको छ, o3-mini, जुन छिटो प्रतिक्रिया, उच्च शुद्धता र कम लागत प्रदान गर्ने विज्ञान, गणित र प्रोग्रामिङ जस्ता क्षेत्रहरूको लागि अनुकूलित छ।
यसको पूर्ववर्ती o1-mini को तुलनामा, o3-mini ले विशेष गरी जटिल समस्याहरू समाधान गर्न आफ्नो अनुमान क्षमताहरूमा उल्लेखनीय सुधार गरेको छ। परीक्षकहरूले 56% द्वारा o3-mini को जवाफहरू रुचाउँछन्, र त्रुटि दर 39% द्वारा घटाइएको छ। आज देखि, ChatGPT प्लस, टोली र प्रो प्रयोगकर्ताहरूले o3-mini प्रयोग गर्न सक्छन्, र नि: शुल्क प्रयोगकर्ताहरू यसको केही सुविधाहरू पनि अनुभव गर्न सक्नुहुन्छ।

अनुमान मोडेल संग तुलना DeepSeek-R1, कति राम्रो छ OpenAI o3-mini R1 भन्दा?
यस लेखले पहिले o3-mini को हाइलाइटहरूको एक सिंहावलोकन दिनेछ, र त्यसपछि हामी प्रत्येक बेन्चमार्कमा दुवै पक्षबाट डेटा निकाल्नेछौं र तिनीहरूलाई दृश्यात्मक रूपमा तुलना गर्न ग्राफ बनाउँछौं। थप रूपमा, हामी o3-mini को मूल्य पनि तुलना गर्नेछौं।
कोर हाइलाइटहरू
1.STEM अप्टिमाइजेसन: गणित, प्रोग्रामिङ, विज्ञान, इत्यादिका क्षेत्रहरूमा उत्कृष्टताहरू, विशेष गरी उच्च अनुमान प्रयास मोडमा o1-mini लाई पार गर्दै।
2.विकासकर्ता कार्यहरू: उत्पादन वातावरणको आवश्यकताहरू पूरा गर्न प्रकार्य कलहरू, संरचित आउटपुट, र विकासकर्ता सन्देशहरू जस्ता कार्यहरूलाई समर्थन गर्दछ।
3.द्रुत प्रतिक्रिया: 24% o1-mini भन्दा छिटो, प्रति अनुरोध 7.7 सेकेन्डको प्रतिक्रिया समयको साथ।
4.सुरक्षा सुधार: गहिरो पङ्क्तिबद्ध प्रविधि मार्फत सुरक्षित र भरपर्दो आउटपुट सुनिश्चित गर्दछ।
5.लागत प्रभावी: अनुमान क्षमताहरू र लागत अप्टिमाइजेसन हातमा जान्छ, AI प्रयोगको लागि थ्रेसहोल्डलाई धेरै कम गर्दै।
तुलना गर्नुहोस्
यसको क्लास हाइलाइट गर्न AI खोल्नुहोस्, यसको आधिकारिक ब्लग केवल यसको आफ्नै मोडेल संग तुलना। तसर्थ, यो लेख DeepSeek R1 पेपर र आधिकारिक OpenAI ब्लगबाट डाटा निकालिएको तालिका हो।
OpenAI आधिकारिक रूपमा तुलना गर्दछ o3-mini संस्करण सूचीमा, यसलाई तीन संस्करणहरूमा तोड्दै: कम, मध्यम र उच्च, जसले अनुमान शक्तिलाई संकेत गर्दछ। DeepSeek ले Math-500 प्रयोग गरेको हुनाले र OpenAI ले गणित डेटासेट प्रयोग गर्दछ, यो तुलना यहाँ हटाइएको छ।

एउटा चार्ट अधिक सहज छ, र Codeforces हटाइयो किनभने मानहरू सहज रूपमा प्रदर्शन गर्न धेरै ठूला छन्। जे होस्, Codeforces मा तुलनाले o3-mini को उच्च अनुमान शक्ति धेरै नेतृत्व छैन भनेर देखाउँछ।

↑१AIME2024→2GPQA डायमंड→3MMLU→4SWE-बेन्च-प्रमाणित
चार्टबाट, कुल 4 तुलनाहरू छन्, र O3-मिनी (उच्च) ले सामान्यतया नेतृत्व गर्छ, तर नेतृत्व धेरै सानो छ।
मूल्य
मोडेल | इनपुट मूल्य | क्यास हिट | आउटपुट मूल्य |
o3-mini | $1.10 | $0.55 | $4.40 |
o1 | $15.00 | $7.50 | $60.00 |
डिपसिक R1 | $0.55 | $0.14 | $2.19 |
सारांश
DeepSeek R1 ले संयुक्त राज्यमा DeepSeek आतंकलाई ट्रिगर गर्दै, सबैभन्दा पहिले खतरा महसुस गर्ने OpenAI थियो, जुन विशेष गरी यसको नयाँ मोडल o3-mini को मूल्य निर्धारणमा प्रस्ट हुन्छ।
जब ओपनई ओ१ पहिलो पटक रिलिज गरिएको थियो, यसको उच्च मूल्यले धेरै विकासकर्ताहरू र प्रयोगकर्ताहरूमा दबाब दियो। १TP५टीको उपस्थितिले सबैलाई थप विकल्पहरू दियो।o1 र R1 बीचको ३० गुणा मूल्य भिन्नता देखि o3-mini को अन्तिम मूल्यमा दुई पटक DeepSeek R1 को मूल्य,
Openai मा DeepSeek R1 को प्रभाव देखाउँछ।यद्यपि, ChatGPT नि:शुल्क प्रयोगकर्ताहरूले सीमित रूपमा o3-mini मात्र अनुभव गर्न सक्छन्, जबकि DeepSeek को गहिरो सोच हाल सबै प्रयोगकर्ताहरूको लागि उपलब्ध छ।म Openai ले प्रयोगकर्ताहरूको लागि प्रयोगको लागत घटाउँदै थप अग्रणी एआई मोडेलहरू ल्याउने आशा गर्दछु।
R1 प्रयोग गर्ने ब्लगरको व्यक्तिगत अनुभवको परिप्रेक्ष्यमा, म भन्न चाहन्छु कि R1 को गहिरो सोचले सधैं मेरो दिमाग खोल्छ। म सुझाव दिन्छु कि सबैले यसलाई समस्याहरूको बारेमा सोच्नको लागि प्रयोग गर्नुहोस्~