
o3-mini na o3-mini (juu) itatolewa leo.

Watumiaji wa kawaida pia watapata o3-mini, na watumiaji zaidi wataweza kutumia o3-mini (juu).
o3-mini (juu) ni takriban pointi 200 zaidi ya o1 kwenye Codeforce, kwa kasi zaidi kuliko o1, na hufanya vyema katika usimbaji na hisabati, lakini gharama bado iko katika kiwango cha o1-mini.

Watumiaji wa Plus wanaweza kutumia o3-mini mara 100 kwa siku. Hata hivyo, kikomo cha matumizi cha o3-mini (juu) kinahitaji kuthibitishwa zaidi.
Baadhi ya watumiaji wa mtandao walisema, ndio, R1 ni maarufu sana hivi kwamba Openai hawezi kujizuia:


Na hapo awali, timu ya Alibaba Qwen ilitoa qwen2.5-max juu ya mkesha wa Mwaka Mpya. Wakati wa Tamasha la Majira ya kuchipua, kila mtu bado anahitaji kucheza, hahaha…
Kwa kweli, mapema kama matangazo ya moja kwa moja ya Krismasi, Openai alitangaza kuwa o3 mini itapatikana mapema 2025:


Bado tunahitaji kuzungumza juu ya nini o3 na o3-mini ni nini?
o3: Muundo wa kisasa wa uelekezaji ambao hufaulu katika usimbaji, hisabati, na hata majaribio ya alama ya alama ya AGI. Inaweka kigezo kipya cha akili na utatuzi wa matatizo.
o3-mini: Toleo la gharama nafuu la o3 ambalo hutoa utendaji bora kwa gharama na kasi ya chini sana.
Miundo hii imechukua mwelekeo mpya kwa kiwango kipya, na kufanya mafanikio katika kazi ngumu iwezekanavyo ambayo yanahitaji uelewa wa kina na mantiki.
o3 huleta mafanikio makubwa matatu.
Uwezo wa kupanga: 71.7% usahihi katika utayarishaji wa vitendo, 20% juu kuliko o1. Pointi 2727 kwenye Codeforces, tayari inazidi kiwango cha binadamu.
Kiwango cha Hisabati: karibu usahihi wa 97% katika raundi ya kufuzu ya Olympiad ya Hisabati ya Marekani. Hata matatizo magumu zaidi ya hisabati ya Epic AI yanaweza kupata matokeo ya 25%.
Jambo la kushangaza zaidi ni jaribio la Arc AGI: 87.5%, kuwapita wanadamu kwa mara ya kwanza kwenye jaribio hili gumu sana la kuigwa.

Kwa nini o3-mini ni uvumbuzi wa kutatiza? O3-mini huleta mabadiliko mawili.
Fikra badilifu: kina cha hoja kinaweza kurekebishwa kulingana na ugumu wa kazi, kwa njia tatu za kuchagua: chini, kati na juu.
Hii inafanya AI iambatane kwa karibu zaidi na matukio ya matumizi ya ulimwengu halisi.
Ufanisi wa gharama: gharama ya chini kuliko o1-mini, majibu ya haraka na matokeo bora zaidi.
Walakini, watumiaji wa mtandao wanalalamika kwamba o3 ya juu hutumia $1,000 kwa kila kazi:

Kwa kuongeza, kuna mifano mingi sana inayopatikana, na bado hatujathibitisha jinsi ya kubadili kati yao.
