ओपनएआईको भर्खरै जारी गरिएको o3-मिनी र DeepSeek R1

ओपनएआईले आफ्नो पछिल्लो इन्फरेन्स मोडेल जारी गरेको छ, o3-mini, जुन छिटो प्रतिक्रिया, उच्च शुद्धता र कम लागत प्रदान गर्ने विज्ञान, गणित र प्रोग्रामिङ जस्ता क्षेत्रहरूको लागि अनुकूलित छ।

यसको पूर्ववर्ती o1-mini को तुलनामा, o3-mini ले विशेष गरी जटिल समस्याहरू समाधान गर्न आफ्नो अनुमान क्षमताहरूमा उल्लेखनीय सुधार गरेको छ। परीक्षकहरूले 56% द्वारा o3-mini को जवाफहरू रुचाउँछन्, र त्रुटि दर 39% द्वारा घटाइएको छ। आज देखि, ChatGPT प्लस, टोली र प्रो प्रयोगकर्ताहरूले o3-mini प्रयोग गर्न सक्छन्, र नि: शुल्क प्रयोगकर्ताहरू यसको केही सुविधाहरू पनि अनुभव गर्न सक्नुहुन्छ।

अनुमान मोडेल संग तुलना DeepSeek-R1, कति राम्रो छ OpenAI o3-mini R1 भन्दा?

यस लेखले पहिले o3-mini को हाइलाइटहरूको एक सिंहावलोकन दिनेछ, र त्यसपछि हामी प्रत्येक बेन्चमार्कमा दुवै पक्षबाट डेटा निकाल्नेछौं र तिनीहरूलाई दृश्यात्मक रूपमा तुलना गर्न ग्राफ बनाउँछौं। थप रूपमा, हामी o3-mini को मूल्य पनि तुलना गर्नेछौं।

सामग्रीको तालिका

कोर हाइलाइटहरू

1.STEM अप्टिमाइजेसन: गणित, प्रोग्रामिङ, विज्ञान, इत्यादिका क्षेत्रहरूमा उत्कृष्टताहरू, विशेष गरी उच्च अनुमान प्रयास मोडमा o1-mini लाई पार गर्दै।

2.विकासकर्ता कार्यहरू: उत्पादन वातावरणको आवश्यकताहरू पूरा गर्न प्रकार्य कलहरू, संरचित आउटपुट, र विकासकर्ता सन्देशहरू जस्ता कार्यहरूलाई समर्थन गर्दछ।

3.द्रुत प्रतिक्रिया: 24% o1-mini भन्दा छिटो, प्रति अनुरोध 7.7 सेकेन्डको प्रतिक्रिया समयको साथ।

4.सुरक्षा सुधार: गहिरो पङ्क्तिबद्ध प्रविधि मार्फत सुरक्षित र भरपर्दो आउटपुट सुनिश्चित गर्दछ।

5.लागत प्रभावी: अनुमान क्षमताहरू र लागत अप्टिमाइजेसन हातमा जान्छ, AI प्रयोगको लागि थ्रेसहोल्डलाई धेरै कम गर्दै।

तुलना गर्नुहोस्

यसको क्लास हाइलाइट गर्न AI खोल्नुहोस्, यसको आधिकारिक ब्लग केवल यसको आफ्नै मोडेल संग तुलना। तसर्थ, यो लेख DeepSeek R1 पेपर र आधिकारिक OpenAI ब्लगबाट डाटा निकालिएको तालिका हो।

OpenAI आधिकारिक रूपमा तुलना गर्दछ o3-mini संस्करण सूचीमा, यसलाई तीन संस्करणहरूमा तोड्दै: कम, मध्यम र उच्च, जसले अनुमान शक्तिलाई संकेत गर्दछ। DeepSeek ले Math-500 प्रयोग गरेको हुनाले र OpenAI ले गणित डेटासेट प्रयोग गर्दछ, यो तुलना यहाँ हटाइएको छ।

एउटा चार्ट अधिक सहज छ, र Codeforces हटाइयो किनभने मानहरू सहज रूपमा प्रदर्शन गर्न धेरै ठूला छन्। जे होस्, Codeforces मा तुलनाले o3-mini को उच्च अनुमान शक्ति धेरै नेतृत्व छैन भनेर देखाउँछ।

↑१AIME2024→2GPQA डायमंड→3MMLU→4SWE-बेन्च-प्रमाणित

चार्टबाट, कुल 4 तुलनाहरू छन्, र O3-मिनी (उच्च) ले सामान्यतया नेतृत्व गर्छ, तर नेतृत्व धेरै सानो छ।

मूल्य

मोडेल	इनपुट मूल्य	क्यास हिट	आउटपुट मूल्य
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
डिपसिक R1	$0.55	$0.14	$2.19

सारांश

DeepSeek R1 ले संयुक्त राज्यमा DeepSeek आतंकलाई ट्रिगर गर्दै, सबैभन्दा पहिले खतरा महसुस गर्ने OpenAI थियो, जुन विशेष गरी यसको नयाँ मोडल o3-mini को मूल्य निर्धारणमा प्रस्ट हुन्छ।

जब ओपनई ओ१ पहिलो पटक रिलिज गरिएको थियो, यसको उच्च मूल्यले धेरै विकासकर्ताहरू र प्रयोगकर्ताहरूमा दबाब दियो। १TP५टीको उपस्थितिले सबैलाई थप विकल्पहरू दियो।o1 र R1 बीचको ३० गुणा मूल्य भिन्नता देखि o3-mini को अन्तिम मूल्यमा दुई पटक DeepSeek R1 को मूल्य,

Openai मा DeepSeek R1 को प्रभाव देखाउँछ।यद्यपि, ChatGPT नि:शुल्क प्रयोगकर्ताहरूले सीमित रूपमा o3-mini मात्र अनुभव गर्न सक्छन्, जबकि DeepSeek को गहिरो सोच हाल सबै प्रयोगकर्ताहरूको लागि उपलब्ध छ।म Openai ले प्रयोगकर्ताहरूको लागि प्रयोगको लागत घटाउँदै थप अग्रणी एआई मोडेलहरू ल्याउने आशा गर्दछु।

R1 प्रयोग गर्ने ब्लगरको व्यक्तिगत अनुभवको परिप्रेक्ष्यमा, म भन्न चाहन्छु कि R1 को गहिरो सोचले सधैं मेरो दिमाग खोल्छ। म सुझाव दिन्छु कि सबैले यसलाई समस्याहरूको बारेमा सोच्नको लागि प्रयोग गर्नुहोस्~

अवर्गीकृत

विश्वका मुख्यधाराका एआई उत्पादनहरू विश्लेषण र व्यापक प्रयोगकर्ता अनुभव दिशानिर्देशहरूमा केन्द्रित छन् (१TP8T र GPT सहित)

द्वाराzddeepseeker फेब्रुअरी १०, २०२५फेब्रुअरी १०, २०२५

फंक्शन पोजिसनिङ र कोर फाइदा विश्लेषण ChatGPT (OpenAI) - अलराउन्डरहरूको लागि विश्वव्यापी बेन्चमार्क ChatGPT प्राविधिक जीनहरू: ठूला मोडेलहरूको GPT श्रृंखलामा आधारित जेनेरेटिभ AI, सामान्य कुराकानी सीप र तार्किक तर्क यसको मुख्य फाइदाहरूको रूपमा। बहुभाषिक प्रशोधन: चिनियाँ भाषामा निरन्तर सुधारको साथ अंग्रेजीमा उत्कृष्ट प्रदर्शन गर्दछ; तर हामी अंग्रेजी प्रयोग गर्न सिफारिस गर्छौं ...

अवर्गीकृत

अली क्वेन२.५-म्याक्सले १TP८T-V३ लाई उछिने! नेटिजन: चीनको एआईले द्रुत गतिमा अन्तर घटाउँदैछ

द्वाराzddeepseeker फेब्रुअरी ५, २०२५फेब्रुअरी ५, २०२५

भर्खरै, अलिबाट बिग मोडेल एरिना सूचीमा अर्को घरेलु मोडेल थपियो, Qwen2.5-Max, जसले DeepSeek-V3 लाई उछिनेर समग्र श्रेणीमा १३३२ को कुल स्कोरका साथ सातौं स्थानमा रह्यो। यसले क्लाउड ३.५ सोनेट र लामा ३.१ ४०५B जस्ता मोडेलहरूलाई पनि एकै झट्कामा उछिनेको छ। विशेष गरी, यो प्रोग्रामिङमा उत्कृष्ट छ...

अवर्गीकृत

जेमिनी २.० ले चार्टमा प्रभुत्व जमाउँछ, जबकि १TP८T V३ ले यसको मूल्यमा रोमाञ्चकता ल्याउँछ, र एक नयाँ लागत-प्रभावी च्याम्पियनको जन्म हुन्छ!

द्वाराzddeepseeker फेब्रुअरी ८, २०२५फेब्रुअरी ८, २०२५

गुगल जेमिनी २.० परिवार अन्ततः पूरा भयो! यो रिलिज हुने बित्तिकै चार्टमा प्रभुत्व जमाउँछ। डिपसिक, क्वेन र ओ३ को खोजी र नाकाबन्दीका बीचमा, गुगलले आज बिहान एकै पटक तीन मोडेलहरू रिलिज गर्‍यो: जेमिनी २.० प्रो, जेमिनी २.० फ्ल्यास र जेमिनी २.० फ्ल्यास-लाइट। ठूलो मोडेल LMSYS रैंकिंगमा, जेमिनी…

अवर्गीकृत

DeepSeek 1 पछाडिको रहस्य | DeepSeekMath र GRPO विवरणहरू

द्वाराzddeepseeker फेब्रुअरी ९, २०२५फेब्रुअरी ९, २०२५

आज म DeepSeek बाट एउटा लेख साझा गर्न चाहन्छु, जसको शीर्षक हो DeepSeekMath: खुला भाषा मोडेलहरूमा गणितीय तर्कको सीमाहरू धकेल्दै। यो लेखले DeepSeekMath 7B लाई परिचय गराउँछ, जुन DeepSeek-Coder-Base-v1.5 7B मा पूर्व-प्रशिक्षित छ जुन 120B गणित-सम्बन्धित टोकनहरू, प्राकृतिक भाषा र कोड डेटाको संग्रहमा आधारित छ। मोडेलले प्रतिस्पर्धात्मक-स्तरमा 51.7% को आश्चर्यजनक स्कोर हासिल गर्यो...

अवर्गीकृत

ताजा खबर ! OpenAI ले आज २ नयाँ इन्फरेन्स मोडलहरू जारी गर्‍यो: o3-mini र o3-mini-high।

द्वाराzddeepseeker फेब्रुअरी १, २०२५फेब्रुअरी १, २०२५

o3-mini र o3-mini (उच्च) आज रिलीज हुनेछ। नियमित प्रयोगकर्ताहरूले o3-mini पनि प्राप्त गर्नेछन्, र थप प्रयोगकर्ताहरूले o3-mini (उच्च) प्रयोग गर्न सक्षम हुनेछन्। o3-mini (उच्च) Codeforce मा o1 भन्दा लगभग 200 अंक बढी छ, o1 भन्दा छिटो छ, र कोडिङ र गणितमा राम्रो प्रदर्शन गर्दछ, तर लागत अझै o1-mini को स्तरमा छ।

अवर्गीकृत

पहिलो प्रक्षेपण! SiliconFlow X Huawei Cloud ले Ascend Cloud मा आधारित DeepSeek R1 र V3 इन्फरेन्सन सेवाहरू संयुक्त रूपमा सुरू गर्यो!

द्वाराzddeepseeker फेब्रुअरी १, २०२५फेब्रुअरी १, २०२५

DeepSeek-R1 र DeepSeek-V3 ले तिनीहरूको खुला स्रोत प्रक्षेपण पछि विश्वव्यापी सनसनी पैदा गरेको छ। तिनीहरू सबै मानवताका लागि DeepSeek टोलीबाट उपहार हुन्, र हामी तिनीहरूको सफलताको लागि ईमानदारीपूर्वक खुसी छौं। सिलिकन मोबिलिटी र हुवावे क्लाउड टोलीहरूले दिनको कडा परिश्रम पछि, आज हामी चिनियाँ प्रयोगकर्ताहरूलाई पनि चिनियाँ…

OpenAI को भर्खरै जारी गरिएको o3-mini र DeepSeek R1 को व्यापक तुलना

कोर हाइलाइटहरू

तुलना गर्नुहोस्

मूल्य

सारांश

अली क्वेन२.५-म्याक्सले १TP८T-V३ लाई उछिने! नेटिजन: चीनको एआईले द्रुत गतिमा अन्तर घटाउँदैछ

DeepSeek 1 पछाडिको रहस्य | DeepSeekMath र GRPO विवरणहरू

ताजा खबर ! OpenAI ले आज २ नयाँ इन्फरेन्स मोडलहरू जारी गर्‍यो: o3-mini र o3-mini-high।

पहिलो प्रक्षेपण! SiliconFlow X Huawei Cloud ले Ascend Cloud मा आधारित DeepSeek R1 र V3 इन्फरेन्सन सेवाहरू संयुक्त रूपमा सुरू गर्यो!

जवाफ लेख्नुहोस्

कोर हाइलाइटहरू

तुलना गर्नुहोस्

मूल्य

सारांश

समान पोस्टहरू

जवाफ लेख्नुहोस् जवाफ रद्द गर्नुहोस्

जवाफ लेख्नुहोस्