Ulinganisho wa kina wa o3-mini mpya ya OpenAI na DeepSeek R1

OpenAI imetoa mfano wake wa hivi karibuni wa uelekezaji, o3-mini, ambayo imeboreshwa kwa nyanja kama vile sayansi, hisabati na upangaji, ikitoa majibu ya haraka, usahihi wa juu na gharama ya chini.

Ikilinganishwa na mtangulizi wake o1-mini, o3-mini imeboresha kwa kiasi kikubwa uwezo wake wa kuelekeza, hasa katika kutatua matatizo changamano. Wanaojaribu hupendelea majibu ya o3-mini kwa 56%, na kiwango cha makosa kimepunguzwa kwa 39%. Kuanzia leo, ChatGPT Plus, Timu na Pro watumiaji wanaweza kutumia o3-mini, na watumiaji bure inaweza pia kupata baadhi ya vipengele vyake.

Ikilinganishwa na mfano wa inference DeepSeek-R1, ni bora kiasi gani OpenAI o3-mini kuliko R1?

Nakala hii itatoa kwanza muhtasari wa mambo muhimu ya o3-mini, na kisha tutatoa data kutoka pande zote mbili kwenye kila alama na kutengeneza grafu ili kuzilinganisha. Kwa kuongeza, tutalinganisha bei ya o3-mini.

Jedwali la Yaliyomo

Vivutio vya msingi

1.Uboreshaji wa STEM: inafaulu katika nyanja za hisabati, programu, sayansi, n.k., hasa inapita o1-mini katika hali ya juu ya uelekezaji.

2.Vipengele vya msanidi programu: hutumia vitendakazi kama vile simu za kukokotoa, utoaji uliopangwa na ujumbe wa msanidi ili kukidhi mahitaji ya mazingira ya uzalishaji.

3.Jibu la haraka: 24% haraka kuliko o1-mini, na muda wa kujibu wa sekunde 7.7 kwa kila ombi.

4.Uboreshaji wa usalama: inahakikisha pato salama na la kuaminika kupitia teknolojia ya upatanishi wa kina.

5.Gharama nafuu: uwezo wa uelekezaji na uboreshaji wa gharama huenda pamoja, na kupunguza sana kiwango cha matumizi ya AI.

Linganisha

Fungua AI Ili kuangazia darasa lake, yake blog rasmi inalinganisha tu na mifano yake mwenyewe. Kwa hivyo, nakala hii ni jedwali lililotolewa kutoka kwa karatasi ya DeepSeek R1 na data kutoka kwa blogi rasmi ya OpenAI.

OpenAI inalinganisha rasmi o3-mini katika orodha ya matoleo, ikigawanyika katika matoleo matatu: ya chini, ya kati na ya juu, ambayo yanaonyesha nguvu ya inference. Kwa kuwa DeepSeek hutumia Math-500 na OpenAI hutumia mkusanyiko wa data wa Hisabati, ulinganisho huu umeondolewa hapa.

Chati ni angavu zaidi, na Codeforces imeondolewa kwa sababu thamani ni kubwa mno kuonyeshwa kwa njia angavu. Walakini, ulinganisho kwenye Codeforces unaonyesha kuwa nguvu ya juu ya o3-mini sio ya kuongoza.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-benchi-Imethibitishwa

Kutoka kwa chati, kuna jumla ya kulinganisha 4, na O3-mini (juu) inaongoza kwa ujumla, lakini uongozi ni mdogo sana.

Bei

mfano	Bei ya kuingiza	Akiba ya hit	Bei ya pato
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Muhtasari

Huku DeepSeek R1 ikianzisha Hofu ya DeepSeek nchini Marekani, ya kwanza kuhisi tishio ilikuwa OpenAI, ambayo inaonekana wazi katika uwekaji bei wa muundo wake mpya o3-mini.

Wakati Openai o1 ilitolewa kwa mara ya kwanza, bei yake ya juu iliweka shinikizo kwa watengenezaji wengi na watumiaji. Kuonekana kwa DeepSeek R1 kuliwapa kila mtu chaguo zaidi.Kutoka kwa tofauti ya bei ya mara 30 kati ya o1 na R1 hadi bei ya mwisho ya o3-mini kuwa mara mbili bei ya DeepSeek R1

inaonyesha athari ya DeepSeek R1 kwenye openai.Hata hivyo, watumiaji wasiolipishwa wa ChatGPT wanaweza kutumia o3-mini kwa muda mfupi tu, huku Fikra Kina ya DeepSeek inapatikana kwa watumiaji wote kwa sasa.Pia ninatarajia openai kuleta modeli za ai zinazoongoza huku nikipunguza gharama ya matumizi kwa watumiaji.

Kwa mtazamo wa uzoefu wa kibinafsi wa mwanablogu anayetumia R1, ningependa kusema kwamba Fikra Kina ya R1 daima hufungua akili yangu. Ninapendekeza kwamba kila mtu aitumie zaidi kufikiria juu ya shida ~

Isiyowekwa katika kundi

Deepseek inaweza kufikia nini? Hata OpenAI haiwezi kuifanya?

Nazddeepseeker Februari 10, 2025Februari 10, 2025

Thamani ya kweli ya DeepSeek haijakadiriwa! DeepSeek-R1 bila shaka imeleta wimbi jipya la shauku kwenye soko. Sio tu kwamba walengwa husika wanaoitwa walengwa wanaongezeka kwa kasi, lakini baadhi ya watu wameunda kozi na programu zinazohusiana na DeepSeek katika jaribio la kupata pesa kutoka kwayo. Tunaamini kuwa ingawa matukio haya yana…

Isiyowekwa katika kundi

Vizalia vya Kubwa vya usimamizi wa Muundo wa Lugha kama vile DeepSeek: Cherry Studio, Chatbox, AnythingLLM, ni nani kiongeza kasi chako cha ufanisi?

Nazddeepseeker Februari 11, 2025Februari 11, 2025

Watu wengi tayari wameanza kusambaza na kutumia Miundo ya Lugha Kubwa ya Deepseek ndani ya nchi, kwa kutumia Chatbox kama zana ya kuibua Makala haya yataendelea kutambulisha vizalia vya usimamizi na taswira ya AI Kubwa ya Lugha ya AI, na italinganisha hizo tatu kwa undani ili kukusaidia kutumia Miundo Kubwa ya Lugha ya AI kwa ufanisi zaidi. Mnamo 2025,…

Isiyowekwa katika kundi

DeepSeek R1 ilikuja kwanza katika jaribio la uandishi wa ubunifu, na o3 mini ilikuwa mbaya zaidi kuliko o1 mini!

Nazddeepseeker Februari 3, 2025Februari 3, 2025

DeepSeek R1 ilishinda ubingwa katika jaribio la kuigwa la uandishi wa hadithi fupi za ubunifu, na kumpita kwa mafanikio mchezaji mkuu wa awali Claude 3.5 Sonnet! Mtihani wa kuigwa Jaribio la kuigwa lililoundwa na mtafiti Lech Mazur si shindano lako la wastani la uandishi. Kila modeli ya AI ilihitajika kukamilisha hadithi fupi 500, na kila hadithi ilibidi ijumuishe kwa ustadi…

Isiyowekwa katika kundi

Cathie Wood: DeepSeek inaongeza tu mchakato wa kupunguza gharama; muundo wa soko uliokithiri uliokithiri unaolinganishwa na Unyogovu Mkuu utabadilika

Nazddeepseeker Februari 8, 2025Februari 8, 2025

Mashindano ya Muhimu na DeepSeek ni mazuri kwa Marekani Cathie Wood: Nadhani inaonyesha kuwa gharama ya uvumbuzi inashuka sana, na kwamba mtindo huu tayari umeanza. Kwa mfano, kabla ya DeepSeek, gharama ya mafunzo ya akili bandia ilishuka kwa 75% kwa mwaka, na gharama ya makisio ilishuka hata kwa 85% hadi…

Isiyowekwa katika kundi

DeepSeek iliundwaje? Uchambuzi wa historia ya ukuaji wa DeepSeek

Nazddeepseeker Februari 3, 2025Februari 3, 2025

Katika siku zijazo, kutakuwa na innovation zaidi na ngumu zaidi. Huenda isiwe rahisi kuelewa sasa, kwa sababu kundi zima la kijamii linahitaji kuelimishwa na ukweli. Jamii hii inaporuhusu watu wanaovumbua hardcore kufanikiwa, mawazo ya pamoja yatabadilika. Tunahitaji tu rundo la ukweli na mchakato….

Isiyowekwa katika kundi

FlashMLA ni nini? Mwongozo wa Kina wa Athari Zake kwenye Kernels za Usimbaji za AI

Na1TP7 Ter Februari 24, 2025Februari 24, 2025

FlashMLA imepata usikivu haraka katika ulimwengu wa akili bandia, haswa katika uwanja wa miundo mikubwa ya lugha (LLMs). Zana hii bunifu, iliyotengenezwa na DeepSeek, hutumika kama kerneli ya kusimbua iliyoboreshwa iliyoundwa kwa ajili ya Hopper GPUs—chips zenye utendakazi wa hali ya juu zinazotumiwa sana katika hesabu za AI. FlashMLA inaangazia uchakataji mzuri wa mfuatano wa urefu tofauti, na kuifanya iwe ya kufaa sana…

Ulinganisho wa kina wa o3-mini na DeepSeek R1 ya OpenAI mpya

Vivutio vya msingi

Linganisha

Bei

Muhtasari

Deepseek inaweza kufikia nini? Hata OpenAI haiwezi kuifanya?

Vizalia vya Kubwa vya usimamizi wa Muundo wa Lugha kama vile DeepSeek: Cherry Studio, Chatbox, AnythingLLM, ni nani kiongeza kasi chako cha ufanisi?

DeepSeek R1 ilikuja kwanza katika jaribio la uandishi wa ubunifu, na o3 mini ilikuwa mbaya zaidi kuliko o1 mini!

Cathie Wood: DeepSeek inaongeza tu mchakato wa kupunguza gharama; muundo wa soko uliokithiri uliokithiri unaolinganishwa na Unyogovu Mkuu utabadilika

DeepSeek iliundwaje? Uchambuzi wa historia ya ukuaji wa DeepSeek

FlashMLA ni nini? Mwongozo wa Kina wa Athari Zake kwenye Kernels za Usimbaji za AI

Toa Jibu Ghairi kujibu

Vivutio vya msingi

Linganisha

Bei

Muhtasari

Machapisho Yanayofanana

Toa Jibu Ghairi kujibu