V okruhu AI DeepSeek R1 ve fyzických testech postupně překonává o1 a Claude a my jsme vstoupili do zlatého věku RL.

Nikdo z nás nečekal, že právě takto začne rok 2025 v oblasti umělé inteligence.

DeepSeek R1 je opravdu úžasný!

V poslední době "tajemná východní mocnost" DeepSeek "tvrdě ovládá" Silicon Valley.

Požádal jsem R1, aby podrobně vysvětlil Pythagorovu větu. To vše umělá inteligence zvládla za méně než 30 sekund bez jediné chyby. Stručně řečeno, její konec.

V domácích i zahraničních kruzích zabývajících se umělou inteligencí objevili běžní uživatelé sítě úžasnou a výkonnou novou umělou inteligenci (která je navíc otevřená) a akademičtí odborníci křičeli "musíme je dohnat". Také se proslýchá, že zahraniční společnosti zabývající se AI již čelí velké hrozbě.

Stačí si vzít tento DeepSeek R1 vydaný tento týden. Jeho čistě posilovací učení bez jakéhokoli tréninku pod dohledem je šokující. Od vývoje základny Deepseek-v3 v prosinci loňského roku až po současné schopnosti myšlenkového řetězce srovnatelné s OpenAI o1 se zdá, že je to otázka času.

Zatímco se však komunita zabývající se umělou inteligencí zabývá čtením technických zpráv a porovnáváním skutečných měření, lidé mají o R1 stále pochybnosti: kromě toho, že dokáže překonat několik benchmarků, může skutečně vést?

Obsah

Dokáže vytvořit vlastní simulace "fyzikálních zákonů"?

Nevěříte tomu? Necháme velkou modelku hrát si s pinballem?

V posledních dnech jsou někteří lidé v komunitě AI posedlí testem - testováním různých velkých modelů AI (zejména tzv. rozumových modelů), které mají vyřešit problém: "Napište skript v jazyce Python, aby se žlutý míček odrazil uvnitř určitého tvaru. Zařiďte, aby se tvar pomalu otáčel, a ujistěte se, že míč zůstane uvnitř tvaru."

Některé modely jsou v tomto srovnávacím testu "rotující koule" lepší než jiné. Podle technického ředitele společnosti CoreView Ivana Fioravantiho má domácí laboratoř umělé inteligence DeepSeek otevřený velký model R1, který překonává model o1 pro společnosti OpenAI, který stojí $200 měsíčně v rámci programu ChatGPT Pro společnosti OpenAI.

Vlevo je OpenAI o1 a vpravo DeepSeek R1. Jak je uvedeno výše, výzva je zde: "Napište skript v Pythonu pro skákající žlutou kouli uvnitř čtverce, ujistěte se, že správně zpracovává detekci kolize. nechte čtverec pomalu rotovat. implementujte ho v Pythonu. ujistěte se, že koule zůstane uvnitř čtverce."

Podle jiného uživatele na X se modely Anthropic Claude 3.5 Sonnet a Gemini 1.5 Pro společnosti Google nesprávně rozhodly o fyzikálních principech, což způsobilo, že se míč odchýlil od svého tvaru. Někteří uživatelé také uváděli, že nejnovější model Gemini 2.0 Flash Thinking Experimental od společnosti Google, stejně jako relativně starší OpenAI GPT-4o, prošly hodnocením najednou.

Existuje však způsob, jak je rozlišit:

Netizens pod tímto tweetem řekl: o1 schopnost byla původně velmi dobrá, ale to se stalo slabší po OpenAI optimalizovat rychlost, a to i s $200/měsíc verze členství.

Simulace skákajícího míče je klasickou programátorskou výzvou. Přesná simulace kombinuje algoritmy pro detekci kolizí, které musí určit, kdy se dva objekty (například míč a strana tvaru) srazí. Nesprávně napsaný algoritmus může ovlivnit výkonnost simulace nebo způsobit zjevné fyzikální chyby.

N8 Programs, výzkumník ze startupu Nous Research, uvedl, že mu trvalo asi dvě hodiny, než od nuly napsal skákající míč v rotujícím sedmiúhelníku. "Je třeba sledovat více souřadnicových systémů, pochopit, jak se v jednotlivých systémech řeší kolize, a kód musí být od základu navržen tak, aby byl robustní."

Ačkoli jsou skákající míče a točící se tvary rozumnou zkouškou programátorských dovedností, stále se jedná o nové projekty pro velké modely a i malé změny v zadání mohou vést k odlišným výsledkům. Má-li se tedy nakonec stát součástí srovnávacího testu pro velké modely umělé inteligence, je třeba jej ještě vylepšit.

Každopádně po této vlně praktických testů máme představu o rozdílech ve schopnostech velkých modelů.

DeepSeek je nový "mýtus Silicon Valley

DeepSeek vyvolává paniku" v celém Tichomoří.

Zaměstnanci společnosti Meta napsali, že "inženýři společnosti Meta horečně analyzují DeepSeek a snaží se z něj okopírovat vše, co se dá."

Alexandr Wang, zakladatel technologického startupu Scale AI, také veřejně prohlásil, že výkon velkého modelu AI společnosti DeepSeek je zhruba stejný jako u nejlepšího modelu ve Spojených státech.

Domnívá se také, že Spojené státy mohly mít v uplynulém desetiletí náskok před Čínou v soutěži o umělou inteligenci, ale vydání velkého modelu AI společností DeepSeek může "vše změnit".

X Blogger @8teAPi se domnívá, že DeepSeek není "vedlejší projekt", ale je jako bývalá "Skunk Works" společnosti Lockheed Martin.

Takzvaná "Skunk Works" označuje přísně důvěrný, relativně nezávislý malý tým, který společnost Lockheed Martin původně založila pro vývoj mnoha pokročilých letadel a který se zabýval výzkumem a vývojem špičkových nebo nekonvenčních technologií. Od průzkumného letounu U-2 a SR-71 Blackbird až po stíhací letoun F-22 Raptor a F-35 Lightning II - všechny tyto stroje pocházely odsud.

Později se tento termín postupně vyvinul v obecný pojem, který se používá pro označení "malých, ale dobrých", relativně nezávislých a flexibilnějších inovačních týmů vytvořených v rámci velkých společností nebo organizací.

Uvedl dva důvody:

Na jedné straně má DeepSeek velký počet GPU, údajně více než 10 000, a Alexandr Wang, generální ředitel společnosti Scale AI, dokonce uvedl, že by mohl dosáhnout 50 000.
Na druhou stranu DeepSeek přijímá talenty pouze ze tří nejlepších čínských univerzit, což znamená, že DeepSeek je stejně konkurenceschopná jako Alibaba a Tencent.

Již tyto dvě skutečnosti ukazují, že společnost DeepSeek dosáhla zjevného obchodního úspěchu a je dostatečně známá, aby mohla tyto prostředky získat.

Pokud jde o náklady na vývoj DeepSeek, blogger uvedl, že čínské technologické společnosti mohou získat řadu dotací, například nízké náklady na elektřinu a využití pozemků.

Je tedy velmi pravděpodobné, že většina nákladů společnosti DeepSeek byla "uložena" na účet mimo hlavní činnost nebo ve formě nějaké dotace na výstavbu datového centra.

Ani kromě zakladatelů nikdo plně nerozumí všem finančním opatřením. Některé dohody mohou být pouze "ústní", které jsou dokončeny pouze na základě pověsti.

Bez ohledu na to je několik věcí jasných:

Model je vynikající, srovnatelný s verzí, kterou OpenAI vydala před dvěma měsíci, a je samozřejmě možné, že není tak dobrý jako nové modely, které OpenAI a Anthropic ještě nevydaly.
Ze současného pohledu ve výzkumu stále dominují americké společnosti. Model DeepSeek je "rychlým pokračováním" verze o1, ale pokrok ve výzkumu a vývoji DeepSeek je velmi rychlý a dohání jej rychleji, než se očekávalo. Nejedná se o plagiátorství ani podvod, nanejvýš o reverzní inženýrství.
Společnost DeepSeek vychovává především své vlastní talenty a nespoléhá se na doktorandy vyškolené v USA, což značně rozšiřuje okruh talentů.
V porovnání s americkými společnostmi podléhá DeepSeek méně omezením, pokud jde o licence na duševní vlastnictví, ochranu soukromí, bezpečnost, politiku atd., a existuje méně obav z neoprávněného použití dat, na kterých lidé nechtějí být školeni. Je méně soudních sporů, méně právníků a méně obav.

Není pochyb o tom, že stále více lidí věří, že rok 2025 bude rozhodující. Podniky se na něj zatím připravují. Například společnost Meta buduje datové centrum o výkonu přes 2 GW, jehož investice do roku 2025 se odhadují na $60-65 miliard a do konce roku bude mít více než 1,3 milionu grafických procesorů.

Společnost Meta dokonce použila graf pro srovnání svého dvougigawattového datového centra s Manhattanem v New Yorku.

Nyní si však DeepSeek vede lépe díky nižším nákladům a menšímu počtu GPU. Jak to, že to lidi neznepokojuje?

Yann LeCun: Musíme poděkovat technickému řediteli a spoluzakladateli společnosti na open source

Hyperbolický, Yuchen Jin, za zveřejnění, že za pouhé 4 dny nám DeepSeek-R1 dokázal 4 skutečnosti:

Open source AI je jen 6 měsíců za closed source AI
Čína dominuje soutěži o otevřený zdrojový kód umělé inteligence
Vstupujeme do zlatého věku posilovacího učení velkých jazykových modelů
Destilační modely jsou velmi výkonné a na mobilních telefonech budeme provozovat vysoce inteligentní umělou inteligenci.

Řetězová reakce vyvolaná DeepSeek stále pokračuje, například OpenAI o3-mini je volně k dispozici, komunita doufá, že se omezí nejasné diskuse o AGI/ASI, a objevují se zvěsti, že Meta je v panice.

Podle něj je těžké předvídat, kdo nakonec zvítězí, ale neměli bychom zapomínat na sílu výhody opozdilce. Koneckonců všichni víme, že to byl Google, kdo vynalezl Transformer, zatímco OpenAI odemkl jeho skutečný potenciál.

Kromě toho se vyjádřil také držitel Turingovy ceny a hlavní vědecký pracovník společnosti Meta pro umělou inteligenci Yann LeCun.

"Ti, kteří si po zhlédnutí výkonu DeepSeek myslí, že "Čína předstihuje USA v oblasti umělé inteligence", se mýlí. Správné chápání je takové, že modely s otevřeným zdrojovým kódem předbíhají modely proprietární."

LeCun uvedl, že důvodem, proč DeepSeek tentokrát dosáhl takového úspěchu, je to, že těžil z otevřeného výzkumu a otevřeného zdrojového kódu (například PyTorch a Llama od společnosti Meta). Společnost DeepSeek přišla s novými nápady a navázala na práci ostatních. Protože je jejich práce veřejně dostupná a má otevřený zdrojový kód, může z ní těžit každý. To je síla otevřeného výzkumu a otevřeného zdrojového kódu.

Úvahy uživatelů sítě pokračují. Jsou sice nadšeni vývojem nových technologií, ale zároveň pociťují i trochu úzkosti. Vždyť vznik DeepSeekers může mít reálný dopad.

V okruhu AI DeepSeek R1 ve fyzických testech postupně překonává o1 a Claude a my jsme vstoupili do zlatého věku RL.

Dokáže vytvořit vlastní simulace "fyzikálních zákonů"?

DeepSeek je nový "mýtus Silicon Valley

Yann LeCun: Musíme poděkovat technickému řediteli a spoluzakladateli společnosti na open source

Čeho může Deepseek dosáhnout? Ani OpenAI to neumí?

Tajemství DeepSeek 1 | Podrobnosti DeepSeekMath a GRPO

Ali Qwen2.5-Max předbíhá DeepSeek-V3! Netizen: Čínská umělá inteligence rychle zmenšuje mezeru

Výklad papíru DeepSeek R1 a klíčové technické body

První spuštění! SiliconFlow X Huawei Cloud společně spouštějí inferenční služby DeepSeek R1 a V3 založené na Ascend Cloud!

Altman: Ohledně open source AI jsme se mýlili! DeepSeek učinil OpenAI méně výhodným a dalším je GPT-5.

Napsat komentář Zrušit odpověď na komentář

Dokáže vytvořit vlastní simulace "fyzikálních zákonů"?

DeepSeek je nový "mýtus Silicon Valley

Yann LeCun: Musíme poděkovat technickému řediteli a spoluzakladateli společnosti na open source

Podobné příspěvky

Napsat komentář Zrušit odpověď na komentář