OpenAI imetoa mfano wake wa hivi karibuni wa uelekezaji, o3-mini, ambayo imeboreshwa kwa nyanja kama vile sayansi, hisabati na upangaji, ikitoa majibu ya haraka, usahihi wa juu na gharama ya chini.

Ikilinganishwa na mtangulizi wake o1-mini, o3-mini imeboresha kwa kiasi kikubwa uwezo wake wa kuelekeza, hasa katika kutatua matatizo changamano. Wanaojaribu hupendelea majibu ya o3-mini kwa 56%, na kiwango cha makosa kimepunguzwa kwa 39%. Kuanzia leo, ChatGPT Plus, Timu na Pro watumiaji wanaweza kutumia o3-mini, na watumiaji bure inaweza pia kupata baadhi ya vipengele vyake.

Ikilinganishwa na mfano wa inference DeepSeek-R1, ni bora kiasi gani OpenAI o3-mini kuliko R1?

Nakala hii itatoa kwanza muhtasari wa mambo muhimu ya o3-mini, na kisha tutatoa data kutoka pande zote mbili kwenye kila alama na kutengeneza grafu ili kuzilinganisha. Kwa kuongeza, tutalinganisha bei ya o3-mini.

Vivutio vya msingi

1.Uboreshaji wa STEM: inafaulu katika nyanja za hisabati, programu, sayansi, n.k., hasa inapita o1-mini katika hali ya juu ya uelekezaji.

2.Vipengele vya msanidi programu: hutumia vitendakazi kama vile simu za kukokotoa, utoaji uliopangwa na ujumbe wa msanidi ili kukidhi mahitaji ya mazingira ya uzalishaji.

3.Jibu la haraka: 24% haraka kuliko o1-mini, na muda wa kujibu wa sekunde 7.7 kwa kila ombi.

4.Uboreshaji wa usalama: inahakikisha pato salama na la kuaminika kupitia teknolojia ya upatanishi wa kina.

5.Gharama nafuu: uwezo wa uelekezaji na uboreshaji wa gharama huenda pamoja, na kupunguza sana kiwango cha matumizi ya AI.

Linganisha

Fungua AI Ili kuangazia darasa lake, yake blog rasmi inalinganisha tu na mifano yake mwenyewe. Kwa hivyo, nakala hii ni jedwali lililotolewa kutoka kwa karatasi ya DeepSeek R1 na data kutoka kwa blogi rasmi ya OpenAI.

OpenAI inalinganisha rasmi o3-mini katika orodha ya matoleo, ikigawanyika katika matoleo matatu: ya chini, ya kati na ya juu, ambayo yanaonyesha nguvu ya inference. Kwa kuwa DeepSeek hutumia Math-500 na OpenAI hutumia mkusanyiko wa data wa Hisabati, ulinganisho huu umeondolewa hapa.

Chati ni angavu zaidi, na Codeforces imeondolewa kwa sababu thamani ni kubwa mno kuonyeshwa kwa njia angavu. Walakini, ulinganisho kwenye Codeforces unaonyesha kuwa nguvu ya juu ya o3-mini sio ya kuongoza.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-benchi-Imethibitishwa

Kutoka kwa chati, kuna jumla ya kulinganisha 4, na O3-mini (juu) inaongoza kwa ujumla, lakini uongozi ni mdogo sana.

Bei

mfanoBei ya kuingizaAkiba ya hitBei ya pato
o3-mini$1.10$0.55$4.40
o1$15.00$7.50$60.00
Deepseek R1$0.55$0.14$2.19

Muhtasari

Huku DeepSeek R1 ikianzisha Hofu ya DeepSeek nchini Marekani, ya kwanza kuhisi tishio ilikuwa OpenAI, ambayo inaonekana wazi katika uwekaji bei wa muundo wake mpya o3-mini.

Wakati Openai o1 ilitolewa kwa mara ya kwanza, bei yake ya juu iliweka shinikizo kwa watengenezaji wengi na watumiaji. Kuonekana kwa DeepSeek R1 kuliwapa kila mtu chaguo zaidi.Kutoka kwa tofauti ya bei ya mara 30 kati ya o1 na R1 hadi bei ya mwisho ya o3-mini kuwa mara mbili bei ya DeepSeek R1

inaonyesha athari ya DeepSeek R1 kwenye openai.Hata hivyo, watumiaji wasiolipishwa wa ChatGPT wanaweza kutumia o3-mini kwa muda mfupi tu, huku Fikra Kina ya DeepSeek inapatikana kwa watumiaji wote kwa sasa.Pia ninatarajia openai kuleta modeli za ai zinazoongoza huku nikipunguza gharama ya matumizi kwa watumiaji.

Kwa mtazamo wa uzoefu wa kibinafsi wa mwanablogu anayetumia R1, ningependa kusema kwamba Fikra Kina ya R1 daima hufungua akili yangu. Ninapendekeza kwamba kila mtu aitumie zaidi kufikiria juu ya shida ~

Machapisho Yanayofanana

Toa Jibu

Barua-pepe haitachapishwa. Fildi za lazima zimetiwa alama ya *