
o3-ሚኒ እና o3-ሚኒ (ከፍተኛ) ዛሬ ይለቀቃል.

መደበኛ ተጠቃሚዎች እንዲሁ ያገኛሉ o3-ሚኒእና በተጨማሪም ተጠቃሚዎች o3-ሚኒ (ከፍተኛ) መጠቀም ይችላሉ።
o3-ሚኒ (ከፍተኛ) በ Codeforce ላይ ከ o1 በ200 ነጥብ ከፍ ያለ ነው፣ ከ o1 ፈጣን ነው፣ እና በኮድ እና በሂሳብ የተሻለ ይሰራል፣ ነገር ግን ዋጋው አሁንም በ o1-ሚኒ ደረጃ ላይ ነው።

በተጨማሪም ተጠቃሚዎች o3-mini በቀን 100 ጊዜ መጠቀም ይችላሉ። ሆኖም የ o3-ሚኒ (ከፍተኛ) የአጠቃቀም ገደብ የበለጠ መረጋገጥ አለበት።
አንዳንድ አውታረ መረቦች አዎ፣ R1 በጣም ታዋቂ ስለሆነ Openai ወደ ኋላ ሊገታ አልቻለም፡ አሉ።


እና ቀደም ብሎ፣ የ Alibaba Qwen ቡድን በአዲስ አመት ዋዜማ qwen2.5-max አውጥቷል። በፀደይ ፌስቲቫል ወቅት፣ ሁሉም ሰው አሁንም መንከባለል አለበት፣ hahaha…
እንደውም ገና በገና የቀጥታ ስርጭቱ ልክ ኦፔናይ o3 mini በ2025 መጀመሪያ ላይ እንደሚገኝ አስታውቋል:


አሁንም ስለ o3 እና o3-mini ምን እንደሆኑ መነጋገር አለብን?
o3፡ በኮዲንግ፣ በሂሳብ እና እንዲያውም በ AGI-ተኮር የቤንችማርክ ሙከራዎች የላቀ ቆራጭ የማጣቀሻ ሞዴል። ለማስተዋል እና ለችግሮች አፈታት አዲስ መለኪያ ያዘጋጃል።
o3-ሚኒበጣም ዝቅተኛ ወጭ እና ፍጥነት የላቀ አፈጻጸምን የሚያቀርብ ወጪ ቆጣቢ የ o3 ስሪት።
እነዚህ ሞዴሎች ጥልቅ ግንዛቤን እና አመክንዮ የሚጠይቁ ውስብስብ ስራዎችን በተቻለ መጠን ወደ አዲስ ደረጃ ወስደዋል ።
o3 ሶስት ዋና ዋና ግኝቶችን ያመጣል።
የፕሮግራም አወጣጥ ችሎታ፡ 71.7% ትክክለኛነት በተግባራዊ ፕሮግራሚንግ፣ 20% ከ o1 በላይ። 2727 በ Codeforces ላይ ነጥቦች, አስቀድሞ የሰው ደረጃ የላቀ.
የሂሳብ ደረጃ፡ በአሜሪካ የሂሳብ ኦሎምፒያድ የማጣሪያ ዙር ወደ 97% ትክክለኛነት። በጣም አስቸጋሪው የኤፒክ AI ድንበር የሂሳብ ችግሮች እንኳን 25% ውጤቶችን ሊያገኙ ይችላሉ።
በጣም የሚያስደንቀው የ Arc AGI ፈተና፡ 87.5%, በዚህ እጅግ አስቸጋሪ የቤንችማርክ ፈተና ለመጀመሪያ ጊዜ ከሰዎች ብልጫ ያለው ነው።

ለምንድን ነው o3-ሚኒ የሚረብሽ ፈጠራ የሆነው? ኦ3-ሚኒ ሁለት ለውጦችን ያመጣል.
የማስተካከያ አስተሳሰብ፡ የአስተሳሰብ ጥልቀት እንደ ሥራው አስቸጋሪነት ሊስተካከል ይችላል, ከሶስት ሁነታዎች ለመምረጥ ዝቅተኛ, መካከለኛ እና ከፍተኛ.
ይህ AI ከእውነተኛው ዓለም የአጠቃቀም ሁኔታዎች ጋር በቅርበት እንዲስማማ ያደርገዋል።
ወጪ ቆጣቢነት ግኝት፡ ከ o1-ሚኒ ያነሰ ዋጋ፣ ፈጣን ምላሽ እና የተሻለ ውጤት።
ነገር ግን ኦ3 ከፍተኛ በአንድ ተግባር $1,000 ይበላል ሲሉ ኔትይዘኖች ያዝናሉ።

በተጨማሪም ፣ በእርግጥ በጣም ብዙ ሞዴሎች አሉ ፣ እና በመካከላቸው እንዴት መቀያየር እንዳለብን እስካሁን ማረጋገጥ የለብንም ።
