Jak powstał DeepSeek? Analiza historii rozwoju DeepSeek

Jak powstał DeepSeek? Analiza historii rozwoju DeepSeek

W przyszłości będzie coraz więcej hardkorowych innowacji. Może to nie być łatwe do zrozumienia teraz, ponieważ cała grupa społeczna musi być edukowana przez fakty. Kiedy to społeczeństwo pozwoli ludziom, którzy wprowadzają innowacje, odnieść sukces, zmieni się zbiorowy sposób myślenia. Potrzebujemy tylko kilku faktów i procesu....

DeepSeek to zrobił! OpenAI przyznaje się do błędu zamkniętego źródła, przewaga lidera maleje

DeepSeek to zrobił! OpenAI przyznaje się do błędu zamkniętego źródła, przewaga lidera maleje

Po tym, jak OpenAI wypuściło model o3-mini, jego CEO Sam Altman, Chief Research Officer Mark Chen, Chief Product Officer Kevin Weil; wiceprezes ds. inżynierii Srinivas Narayanan, Head of API Research Michelle Pokrass i Head of Research Hongyu Ren, przeprowadzili techniczne pytania i odpowiedzi online na reddit, jednym z największych na świecie wszechstronnych forów. Główne tematy...

OpenAI o3-mini vs. DeepSeek-R1: Kto jest królem nowej generacji modeli AI?

OpenAI o3-mini vs. DeepSeek-R1: Kto jest królem nowej generacji modeli AI?

o3-mini już jest, z impetem pretendenta 31 stycznia OpenAI wydało zupełnie nowy duży model o3-mini i udostępniło niektóre z jego funkcji za darmo wszystkim użytkownikom ChatGPT. Chociaż istnieje ograniczenie liczby zapytań, pozwala to użytkownikom doświadczyć najnowszego komercyjnego modelu OpenAI tak szybko, jak to możliwe....

Pierwsze uruchomienie! SiliconFlow X Huawei Cloud wspólnie uruchamiają usługi wnioskowania DeepSeek R1 i V3 w oparciu o Ascend Cloud!

Pierwsze uruchomienie! SiliconFlow X Huawei Cloud wspólnie uruchamiają usługi wnioskowania DeepSeek R1 i V3 w oparciu o Ascend Cloud!

DeepSeek-R1 i DeepSeek-V3 wywołały globalną sensację od czasu ich uruchomienia na zasadach open source. Są prezentem od zespołu DeepSeek dla całej ludzkości i szczerze cieszymy się z ich sukcesu. Po wielu dniach ciężkiej pracy zespołów Silicon Mobility i Huawei Cloud, dziś dajemy również chińskim użytkownikom...

Kompleksowe porównanie nowo wydanych o3-mini i DeepSeek R1 firmy OpenAI

Kompleksowe porównanie nowo wydanych o3-mini i DeepSeek R1 firmy OpenAI

OpenAI wydało swój najnowszy model wnioskowania, o3-mini, który jest zoptymalizowany pod kątem takich dziedzin jak nauki ścisłe, matematyka i programowanie, zapewniając szybszą reakcję, wyższą dokładność i niższe koszty. W porównaniu do swojego poprzednika o1-mini, o3-mini znacznie poprawił swoje możliwości wnioskowania, zwłaszcza w rozwiązywaniu złożonych problemów. Testerzy preferują odpowiedzi o3-mini na poziomie 56%, a poziom błędów...

W kręgu sztucznej inteligencji DeepSeek R1 stale przewyższa o1 i Claude w testach fizycznych, a my wkroczyliśmy w złotą erę RL.

Nikt z nas nie spodziewał się, że tak rozpocznie się rok 2025 w dziedzinie sztucznej inteligencji. DeepSeek R1 jest naprawdę niesamowity! Ostatnio "tajemnicza wschodnia potęga" DeepSeek "twardo kontroluje" Dolinę Krzemową. Poprosiłem R1 o szczegółowe wyjaśnienie twierdzenia Pitagorasa. Wszystko to zostało zrobione przez sztuczną inteligencję w mniej niż 30 sekund bez...

Najświeższe wiadomości! OpenAI wydało dziś 2 nowe modele wnioskowania: o3-mini i o3-mini-high.

Najświeższe wiadomości! OpenAI wydało dziś 2 nowe modele wnioskowania: o3-mini i o3-mini-high.

o3-mini i o3-mini (high) zostaną wydane dzisiaj. Zwykli użytkownicy otrzymają również o3-mini, a użytkownicy plus będą mogli korzystać z o3-mini (high). o3-mini (high) jest o około 200 punktów wyższa niż o1 na Codeforce, szybsza niż o1 i osiąga lepsze wyniki w kodowaniu i matematyce, ale koszt jest nadal na poziomie o1-mini....

Altman: Myliliśmy się co do open source AI! DeepSeek sprawił, że OpenAI stało się mniej korzystne, a następnym jest GPT-5

Altman: Myliliśmy się co do open source AI! DeepSeek sprawił, że OpenAI stało się mniej korzystne, a następnym jest GPT-5

o3-mini pojawiło się późno w nocy, a OpenAI w końcu ujawniło swój najnowszy atut. Podczas Reddit AMA Q&A, Altman głęboko wyznał, że stał po złej stronie open source AI. Powiedział, że wewnętrzna strategia open source jest rozważana, a model będzie nadal rozwijany, ale...

Paper-DeepSeek-R1: Motywowanie zdolności rozumowania w LLM poprzez uczenie się ze wzmocnieniem

Streszczenie Niniejszy artykuł przedstawia modele rozumowania DeepSeek pierwszej generacji: DeepSeek-R1-Zero i DeepSeek-R1. DeepSeek-R1-Zero, wytrenowany poprzez wielkoskalowe uczenie ze wzmocnieniem (RL) bez nadzorowanego dostrajania (SFT), wykazuje niezwykłe możliwości rozumowania. Dzięki RL naturalnie rozwija potężne zachowania rozumowania. Napotyka jednak wyzwania, takie jak słaba czytelność i mieszanie języków. Aby rozwiązać te problemy i zwiększyć wydajność rozumowania, opracowano DeepSeek-R1,...