Najświeższe wiadomości! OpenAI wydało dziś 2 nowe modele wnioskowania: o3-mini i o3-mini-high.

o3-mini i o3-mini (high) zostaną wydane dzisiaj.

Stali użytkownicy otrzymają również o3-mini, a użytkownicy Plus będą mogli korzystać z o3-mini (high).

o3-mini (high) jest o około 200 punktów wyższa niż o1 na Codeforce, szybsza niż o1 i osiąga lepsze wyniki w kodowaniu i matematyce, ale koszt jest nadal na poziomie o1-mini.

Użytkownicy Plusa mogą korzystać z o3-mini 100 razy dziennie. Jednak limit użytkowania o3-mini (wysoki) wymaga dalszego potwierdzenia.

Niektórzy internauci stwierdzili, że tak, R1 jest tak popularny, że Openai nie może się powstrzymać:

A wcześniej zespół Alibaba Qwen wydał qwen2.5-max w Sylwestra. Podczas Festiwalu Wiosny wszyscy nadal muszą się rozwijać, hahaha...

W rzeczywistości, już podczas świątecznej transmisji na żywo, Openai ogłosiło, że o3 mini będzie dostępne na początku 2025 roku:

Spis treści

Nadal musimy porozmawiać o tym, czym są o3 i o3-mini?

o3: Najnowocześniejszy model wnioskowania, który wyróżnia się w kodowaniu, matematyce, a nawet testach porównawczych zorientowanych na AGI. Ustanawia nowy punkt odniesienia dla inteligencji i rozwiązywania problemów.

o3-mini: Ekonomiczna wersja o3, która zapewnia doskonałą wydajność przy bardzo niskich kosztach i szybkości.

Modele te przeniosły wnioskowanie na zupełnie nowy poziom, umożliwiając przełom w złożonych zadaniach, które wymagają dogłębnego zrozumienia i logiki.

o3 przynosi trzy główne przełomy.

Zdolność programowania: dokładność 71,7% w praktycznym programowaniu, 20% wyższa niż o1. 2727 punktów na Codeforces, już przewyższając poziom ludzki.

Poziom matematyczny: prawie 97% dokładności w rundzie kwalifikacyjnej Olimpiady Matematycznej w USA. Nawet najtrudniejsze problemy matematyczne Epic AI Frontier mogą uzyskać wyniki 25%.

Najbardziej zdumiewający jest test Arc AGI: 87,5%, po raz pierwszy przewyższając ludzi w tym niezwykle trudnym teście porównawczym.

Dlaczego o3-mini jest przełomową innowacją? O3-mini wprowadza dwie zmiany.

Adaptacyjne myślenie: głębokość rozumowania można dostosować do trudności zadania, z trzema trybami do wyboru: niskim, średnim i wysokim.

Dzięki temu sztuczna inteligencja jest lepiej dostosowana do rzeczywistych scenariuszy użytkowania.

Przełom w zakresie opłacalności: niższy koszt niż w przypadku o1-mini, szybsza reakcja i lepsze wyniki.

Jednak internauci narzekają, że o3 high zużywa $1,000 na zadanie:

Ponadto dostępnych jest zbyt wiele modeli, a my musimy jeszcze potwierdzić, jak się między nimi przełączać.

Uncategorized

Pierwsze uruchomienie! SiliconFlow X Huawei Cloud wspólnie uruchamiają usługi wnioskowania DeepSeek R1 i V3 w oparciu o Ascend Cloud!

Przezzddeepseeker 1 lutego 2025 r.1 lutego 2025 r.

DeepSeek-R1 i DeepSeek-V3 wywołały globalną sensację od czasu ich uruchomienia na zasadach open source. Są prezentem od zespołu DeepSeek dla całej ludzkości i szczerze cieszymy się z ich sukcesu. Po wielu dniach ciężkiej pracy zespołów Silicon Mobility i Huawei Cloud, dziś dajemy również chińskim użytkownikom...

Uncategorized

Jest blisko DeepSeek-R1-32B i miażdży s1 Fei-Fei Li! UC Berkeley i inne otwarte nowe modele wnioskowania SOTA

Przezzddeepseeker 14 lutego 202514 lutego 2025

Model wnioskowania 32B wykorzystuje tylko 1/8 danych i jest na równi z DeepSeek-R1 tej samej wielkości! Właśnie teraz instytucje takie jak Stanford, UC Berkeley i University of Washington wspólnie wydały model wnioskowania na poziomie SOTA, OpenThinker-32B, a także udostępniły jako open source do 114 tys. danych treningowych. Strona główna projektu OpenThinker: OpenThinker Hugging Face:…

Uncategorized

Paper-DeepSeek-R1: Motywowanie zdolności rozumowania w LLM poprzez uczenie się ze wzmocnieniem

Przezdeepseeker styczeń 29, 2025styczeń 29, 2025

Streszczenie Niniejszy artykuł przedstawia modele rozumowania DeepSeek pierwszej generacji: DeepSeek-R1-Zero i DeepSeek-R1. DeepSeek-R1-Zero, wytrenowany poprzez wielkoskalowe uczenie ze wzmocnieniem (RL) bez nadzorowanego dostrajania (SFT), wykazuje niezwykłe możliwości rozumowania. Dzięki RL naturalnie rozwija potężne zachowania rozumowania. Napotyka jednak wyzwania, takie jak słaba czytelność i mieszanie języków. Aby rozwiązać te problemy i zwiększyć wydajność rozumowania, opracowano DeepSeek-R1,...

Uncategorized

Kompleksowe porównanie nowo wydanych o3-mini i DeepSeek R1 firmy OpenAI

Przezzddeepseeker 1 lutego 2025 r.1 lutego 2025 r.

OpenAI wydało swój najnowszy model wnioskowania, o3-mini, który jest zoptymalizowany pod kątem takich dziedzin jak nauki ścisłe, matematyka i programowanie, zapewniając szybszą reakcję, wyższą dokładność i niższe koszty. W porównaniu do swojego poprzednika o1-mini, o3-mini znacznie poprawił swoje możliwości wnioskowania, zwłaszcza w rozwiązywaniu złożonych problemów. Testerzy preferują odpowiedzi o3-mini na poziomie 56%, a poziom błędów...

Uncategorized

DeepSeek TOP17 Najlepsze alternatywy: kompleksowa analiza (2025)

Przezdeepseeker 6 lutego 20256 lutego 2025

Wprowadzenie W szybko ewoluującym krajobrazie sztucznej inteligencji DeepSeek wyłonił się jako potężny model języka. Ta kompleksowa analiza bada 17 najlepszych alternatyw dla DeepSeek, badając ich unikalne cechy, możliwości i przypadki użycia. Nasze badania koncentrują się na platformach międzynarodowych i chińskich, które oferują integrację DeepSeek lub podobne możliwości. Analiza najlepszych alternatyw 1….

Uncategorized

Najnowsze wiadomości! Badacz DeepSeek ujawnia online: szkolenie R1 trwało tylko dwa do trzech tygodni, a potężną ewolucję R1 zero zaobserwowano podczas chińskiego Nowego Roku

Przezzddeepseeker 4 lutego 20254 lutego 2025

Najnowsze wiadomości! Badacz DeepSeek ujawnia online: szkolenie R1 zajęło tylko dwa do trzech tygodni, a potężną ewolucję R1 zero zaobserwowano podczas chińskiego Nowego Roku Właśnie zauważyliśmy, że badacz DeepSeek Daya Guo odpowiedział na pytania internautów dotyczące DeepSeek R1 i planów firmy na przyszłość. Możemy tylko powiedzieć…

Nadal musimy porozmawiać o tym, czym są o3 i o3-mini?

o3 przynosi trzy główne przełomy.

Dlaczego o3-mini jest przełomową innowacją? O3-mini wprowadza dwie zmiany.

Podobne posty

Dodaj komentarz Anuluj pisanie odpowiedzi