Kompleksowe porównanie nowo wydanych o3-mini i DeepSeek R1 OpenAI

OpenAI opublikowało swój najnowszy model wnioskowania, o3-miniktóry jest zoptymalizowany pod kątem dziedzin takich jak nauki ścisłe, matematyka i programowanie, zapewniając szybszą reakcję, większą dokładność i niższe koszty.

W porównaniu do swojego poprzednika o1-mini, o3-mini znacznie poprawił swoje możliwości wnioskowania, szczególnie w rozwiązywaniu złożonych problemów. Testerzy preferują odpowiedzi o3-mini o 56%, a wskaźnik błędów został zmniejszony o 39%. Od dzisiaj, ChatGPT Plus, Zespół oraz Zawodowiec użytkownicy mogą korzystać z o3-mini, a wolni użytkownicy mogą również doświadczyć niektórych z jego funkcji.

W porównaniu z modelem wnioskowania DeepSeek-R1o ile lepszy jest OpenAI o3-mini niż R1?

W tym artykule najpierw przedstawimy przegląd najważniejszych cech o3-mini, a następnie wyodrębnimy dane z obu stron dla każdego benchmarku i stworzymy wykres, aby wizualnie je porównać. Ponadto porównamy również cenę o3-mini.

Spis treści

Najważniejsze wydarzenia

1.Optymalizacja STEM: wyróżnia się w dziedzinie matematyki, programowania, nauk ścisłych itp., szczególnie przewyższając o1-mini w trybie wysokiego wysiłku wnioskowania.

2.Funkcje deweloperskieObsługuje funkcje takie jak wywołania funkcji, ustrukturyzowane dane wyjściowe i komunikaty programistyczne, aby spełnić potrzeby środowiska produkcyjnego.

3.Szybka reakcja24% szybciej niż o1-mini, z czasem odpowiedzi 7,7 sekundy na żądanie.

4.Poprawa bezpieczeństwaZapewnia bezpieczne i niezawodne wyjście dzięki technologii głębokiego wyrównania.

5.OpłacalnośćMożliwości wnioskowania i optymalizacja kosztów idą w parze, znacznie obniżając próg wykorzystania sztucznej inteligencji.

Porównaj

Otwarta sztuczna inteligencja Aby podkreślić swoją klasę, jej oficjalny blog porównuje go tylko z własnymi modelami. Dlatego ten artykuł jest tabelą wyodrębnioną z artykułu DeepSeek R1 i danych z oficjalnego bloga OpenAI.

OpenAI oficjalnie porównuje o3-mini na liście wersji, dzieląc ją na trzy wersje: niską, średnią i wysoką, które wskazują siłę wnioskowania. Ponieważ DeepSeek używa Math-500, a OpenAI używa zbioru danych Math, porównanie to zostało tutaj usunięte.

Wykres jest bardziej intuicyjny, a Codeforces został usunięty, ponieważ wartości są zbyt duże, aby można je było wyświetlić intuicyjnie. Porównanie na Codeforces pokazuje jednak, że wysoka siła wnioskowania o3-mini nie jest dużą przewagą.

↑1AIME2024→2GPQA Diamond→3MMLU→4SWE-bench-Verified

Z wykresu wynika, że istnieją w sumie 4 porównania, a O3-mini (high) generalnie prowadzi, ale przewaga jest bardzo niewielka.

Cena

model	Cena wejściowa	Uderzenie pamięci podręcznej	Cena wyjściowa
o3-mini	$1.10	$0.55	$4.40
o1	$15.00	$7.50	$60.00
Deepseek R1	$0.55	$0.14	$2.19

Podsumowanie

Po tym, jak DeepSeek R1 wywołał panikę DeepSeek w Stanach Zjednoczonych, pierwszym, który poczuł się zagrożony, był OpenAI, co jest szczególnie widoczne w cenach nowego modelu o3-mini.

Kiedy Openai o1 został wydany po raz pierwszy, jego wysoka cena wywarła presję na wielu programistach i użytkownikach. Pojawienie się DeepSeek R1 dało wszystkim większy wybór.Od 30-krotnej różnicy w cenie między o1 i R1 do ostatecznej ceny o3-mini wynoszącej dwukrotność cena DeepSeek R1,

pokazuje wpływ DeepSeek R1 na openai.Darmowi użytkownicy ChatGPT mogą jednak korzystać z o3-mini tylko w ograniczonym zakresie, podczas gdy Deep Thinking od DeepSeek jest obecnie dostępne dla wszystkich użytkowników.Oczekuję również, że openai wprowadzi więcej wiodących modeli ai, jednocześnie obniżając koszty użytkowania dla użytkowników.

Z perspektywy osobistego doświadczenia blogera korzystającego z R1, chciałbym powiedzieć, że Głębokie Myślenie w R1 zawsze otwiera mój umysł. Polecam wszystkim, by używali go częściej do myślenia o problemach~.

Uncategorized

Główne produkty z zakresu sztucznej inteligencji na świecie koncentrują się na analizie i kompleksowych wytycznych dotyczących doświadczeń użytkowników (w tym DeepSeek i GPT)

Przezzddeepseeker luty 10, 2025luty 10, 2025

Pozycjonowanie funkcji i analiza głównych zalet ChatGPT (OpenAI) – globalny punkt odniesienia dla wszechstronnych ChatGPT Geny techniczne: generatywna sztuczna inteligencja oparta na serii dużych modeli GPT, której głównymi zaletami są ogólne umiejętności konwersacyjne i logiczne rozumowanie. Przetwarzanie wielojęzyczne: najlepiej sprawdza się w języku angielskim, z ciągłą poprawą w języku chińskim; zalecamy jednak używanie języka angielskiego do…

Uncategorized

Jak powstał DeepSeek? Analiza historii rozwoju DeepSeek

Przezzddeepseeker 3 lutego 20253 lutego 2025

W przyszłości będzie coraz więcej hardkorowych innowacji. Może to nie być łatwe do zrozumienia teraz, ponieważ cała grupa społeczna musi być edukowana przez fakty. Kiedy to społeczeństwo pozwoli ludziom, którzy wprowadzają innowacje, odnieść sukces, zmieni się zbiorowy sposób myślenia. Potrzebujemy tylko kilku faktów i procesu....

Uncategorized

DeepSeek udostępnił swój kod źródłowy i szczegółowe wyjaśnienie FlashMLA

Przezzddeepseeker luty 24, 2025luty 24, 2025

W zeszłym tygodniu DeepSeek ogłosiło, że w przyszłym tygodniu udostępni pięć projektów jako open source: Internauci powiedzieli: „Tym razem OpenAI naprawdę tu jest”. Właśnie pojawił się pierwszy projekt typu open source, związany z przyspieszeniem wnioskowania, FlashMLA: Adres projektu typu open source: DeepSeek FlashMLA Jest on projektem typu open source od dwóch godzin, a Github ma już ponad 2,7 tys. gwiazdek: The…

Uncategorized

Sekret kryjący się za DeepSeek 1 | DeepSeekMath i szczegóły GRPO

Przezzddeepseeker luty 9, 2025luty 9, 2025

Dzisiaj chciałbym podzielić się artykułem z DeepSeek zatytułowanym DeepSeekMath: Przesuwanie granic rozumowania matematycznego w otwartych modelach językowych. W tym artykule przedstawiono DeepSeekMath 7B, który został wstępnie wytrenowany na DeepSeek-Coder-Base-v1.5 7B w oparciu o zbiór 120B tokenów matematycznych, języka naturalnego i danych kodowych. Model osiągnął niesamowity wynik 51,7% w konkurencyjnym…

Uncategorized

Jest blisko DeepSeek-R1-32B i miażdży s1 Fei-Fei Li! UC Berkeley i inne otwarte nowe modele wnioskowania SOTA

Przezzddeepseeker 14 lutego 202514 lutego 2025

Model wnioskowania 32B wykorzystuje tylko 1/8 danych i jest na równi z DeepSeek-R1 tej samej wielkości! Właśnie teraz instytucje takie jak Stanford, UC Berkeley i University of Washington wspólnie wydały model wnioskowania na poziomie SOTA, OpenThinker-32B, a także udostępniły jako open source do 114 tys. danych treningowych. Strona główna projektu OpenThinker: OpenThinker Hugging Face:…

Uncategorized

Ujawniono technologię DeepSeek-R1: podstawowe zasady artykułu zostały rozbite na czynniki pierwsze, a klucz do przełomowej wydajności modelu został ujawniony

Przezzddeepseeker luty 9, 2025luty 9, 2025

Dzisiaj podzielimy się DeepSeek R1, tytuł: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning ability of LLM via enhancement learning. W tym artykule przedstawiono pierwszą generację modeli rozumowania DeepSeek, DeepSeek-R1-Zero i DeepSeek-R1. Model DeepSeek-R1-Zero został wytrenowany poprzez uczenie się wzmacniające na dużą skalę (RL) bez nadzorowanego dostrajania (SFT) jako początkowego kroku,…

Kompleksowe porównanie nowo wydanych o3-mini i DeepSeek R1 firmy OpenAI

Najważniejsze wydarzenia

Porównaj

Cena

Podsumowanie

Główne produkty z zakresu sztucznej inteligencji na świecie koncentrują się na analizie i kompleksowych wytycznych dotyczących doświadczeń użytkowników (w tym DeepSeek i GPT)

Jak powstał DeepSeek? Analiza historii rozwoju DeepSeek

DeepSeek udostępnił swój kod źródłowy i szczegółowe wyjaśnienie FlashMLA

Sekret kryjący się za DeepSeek 1 | DeepSeekMath i szczegóły GRPO

Jest blisko DeepSeek-R1-32B i miażdży s1 Fei-Fei Li! UC Berkeley i inne otwarte nowe modele wnioskowania SOTA

Ujawniono technologię DeepSeek-R1: podstawowe zasady artykułu zostały rozbite na czynniki pierwsze, a klucz do przełomowej wydajności modelu został ujawniony

Dodaj komentarz Anuluj pisanie odpowiedzi

Najważniejsze wydarzenia

Porównaj

Cena

Podsumowanie

Podobne posty

Dodaj komentarz Anuluj pisanie odpowiedzi