o3-mini i o3-mini (high) zostaną wydane dzisiaj.

Stali użytkownicy otrzymają również o3-mini, a użytkownicy Plus będą mogli korzystać z o3-mini (high).

o3-mini (high) jest o około 200 punktów wyższa niż o1 na Codeforce, szybsza niż o1 i osiąga lepsze wyniki w kodowaniu i matematyce, ale koszt jest nadal na poziomie o1-mini.

Użytkownicy Plusa mogą korzystać z o3-mini 100 razy dziennie. Jednak limit użytkowania o3-mini (wysoki) wymaga dalszego potwierdzenia.

Niektórzy internauci stwierdzili, że tak, R1 jest tak popularny, że Openai nie może się powstrzymać:

A wcześniej zespół Alibaba Qwen wydał qwen2.5-max w Sylwestra. Podczas Festiwalu Wiosny wszyscy nadal muszą się rozwijać, hahaha...

W rzeczywistości, już podczas świątecznej transmisji na żywo, Openai ogłosiło, że o3 mini będzie dostępne na początku 2025 roku:

Nadal musimy porozmawiać o tym, czym są o3 i o3-mini?

o3: Najnowocześniejszy model wnioskowania, który wyróżnia się w kodowaniu, matematyce, a nawet testach porównawczych zorientowanych na AGI. Ustanawia nowy punkt odniesienia dla inteligencji i rozwiązywania problemów.

o3-mini: Ekonomiczna wersja o3, która zapewnia doskonałą wydajność przy bardzo niskich kosztach i szybkości.

Modele te przeniosły wnioskowanie na zupełnie nowy poziom, umożliwiając przełom w złożonych zadaniach, które wymagają dogłębnego zrozumienia i logiki.

o3 przynosi trzy główne przełomy.

Zdolność programowania: dokładność 71,7% w praktycznym programowaniu, 20% wyższa niż o1. 2727 punktów na Codeforces, już przewyższając poziom ludzki.

Poziom matematyczny: prawie 97% dokładności w rundzie kwalifikacyjnej Olimpiady Matematycznej w USA. Nawet najtrudniejsze problemy matematyczne Epic AI Frontier mogą uzyskać wyniki 25%.

Najbardziej zdumiewający jest test Arc AGI: 87,5%, po raz pierwszy przewyższając ludzi w tym niezwykle trudnym teście porównawczym.

Dlaczego o3-mini jest przełomową innowacją? O3-mini wprowadza dwie zmiany.

Adaptacyjne myślenie: głębokość rozumowania można dostosować do trudności zadania, z trzema trybami do wyboru: niskim, średnim i wysokim.

Dzięki temu sztuczna inteligencja jest lepiej dostosowana do rzeczywistych scenariuszy użytkowania.

Przełom w zakresie opłacalności: niższy koszt niż w przypadku o1-mini, szybsza reakcja i lepsze wyniki.

Jednak internauci narzekają, że o3 high zużywa $1,000 na zadanie:

Ponadto dostępnych jest zbyt wiele modeli, a my musimy jeszcze potwierdzić, jak się między nimi przełączać.

Podobne posty

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *