Nezařazené - Deepseek R1

Tajemství DeepSeek 1 | Podrobnosti DeepSeekMath a GRPO

Nezařazené

Tajemství DeepSeek 1 | Podrobnosti DeepSeekMath a GRPO

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

Dnes bych se rád podělil o článek od DeepSeek s názvem DeepSeekMath: Posouvání limitů matematického uvažování v modelech otevřených jazyků. Tento článek představuje DeepSeekMath 7B, který je předtrénován na DeepSeek-Coder-Base-v1.5 7B na základě kolekce 120B matematických tokenů, přirozeného jazyka a dat kódu. Model dosáhl úžasného skóre 51,7% v soutěžní úrovni…

Nezařazené

Technologie DeepSeek-R1 odhalena: základní principy papíru jsou rozebrány a klíč k průlomovému výkonu modelu je odhalen

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

Dnes se podělíme o DeepSeek R1, Název: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM through training learning. Tento článek představuje první generaci uvažovacích modelů DeepSeek, DeepSeek-R1-Zero a DeepSeek-R1. Model DeepSeek-R1-Zero byl trénován pomocí rozsáhlého učení výztuže (RL) bez doladění pod dohledem (SFT) jako počáteční krok,…

Nezařazené

Výklad papíru DeepSeek R1 a klíčové technické body

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

1 Pozadí Během jarního festivalu DeepSeek R1 opět přitáhl širokou pozornost a dokonce i článek o interpretaci DeepSeek V3, který jsme dříve napsali, byl také znovu vysílán a hodně diskutován. Přestože bylo provedeno mnoho analýz a reprodukcí DeepSeek R1, rozhodli jsme se sestavit několik odpovídajících poznámek ke čtení. Použijeme tři…

Nízkonákladový model společnosti Google, řada Gemini 2.0, útočí: boj o hospodárnost u velkých modelů se přiostřuje

Nezařazené

Nízkonákladový model společnosti Google, řada Gemini 2.0, útočí: boj o hospodárnost u velkých modelů se přiostřuje

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Vysoké náklady na používání velkých modelů umělé inteligence jsou hlavním důvodem, proč mnoho aplikací umělé inteligence dosud nebylo implementováno a propagováno. Volba extrémního výkonu znamená obrovské náklady na výpočetní výkon, což vede k vysokým nákladům na používání, které běžní uživatelé nemohou akceptovat. Konkurence pro velké modely AI je jako válka bez kouře. Po…

Gemini 2.0 dominuje žebříčkům, zatímco DeepSeek V3 pláče ve své ceně a nový nákladově efektivní šampion je na světě!

Nezařazené

Gemini 2.0 dominuje žebříčkům, zatímco DeepSeek V3 pláče ve své ceně a nový nákladově efektivní šampion je na světě!

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Rodina Google Gemini 2.0 je konečně kompletní! Vévodí žebříčkům hned po vydání. Uprostřed pronásledování a blokád Deepseek, Qwen a o3 vydal Google dnes brzy ráno tři modely najednou: Gemini 2.0 Pro, Gemini 2.0 Flash a Gemini 2.0 Flash-Lite. V žebříčku velkých modelů LMSYS, Gemini…

Dialog a16z s 27letým generálním ředitelem: AI Agent má obrovský pákový efekt a dlouhodobé ceny budou spojeny s mzdovými náklady

Nezařazené

Dialog a16z s 27letým generálním ředitelem: AI Agent má obrovský pákový efekt a dlouhodobé ceny budou spojeny s mzdovými náklady

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Hlavní body AI Agent přetváří zákaznickou zkušenost Jesse Zhang: Jak je vlastně vytvořen agent? Náš názor je, že postupem času se bude stále více podobat agentovi založenému na přirozeném jazyce, protože tak se školí velké jazykové modely (LLM). Z dlouhodobého hlediska, pokud máte super inteligentního agenta, který…

Nezařazené

Cathie Wood: DeepSeek jen urychluje proces snižování nákladů; extrémně koncentrovaná tržní struktura srovnatelná s Velkou hospodářskou krizí se změní

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Hlavní body Konkurence s DeepSeek je dobrá pro americkou Cathie Wood: Myslím, že ukazuje, že náklady na inovace dramaticky klesají a že tento trend již začal. Například před DeepSeek náklady na výcvik umělé inteligence klesly o 75% ročně a náklady na odvození dokonce o 85% na…

Nezařazené

Google vydal tři nové modely najednou: Gemini-2.0-Pro je zdarma, má vynikající skóre a je na prvním místě a je vhodný pro kódování a zpracování složitých výzev!

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Příběh Gemini 2.0 se zrychluje. Prosincová verze Flash Thinking Experimental přinesla vývojářům pracovní model s nízkou latencí a vysokým výkonem. Začátkem tohoto roku byla v Google AI Studio aktualizována verze 2.0 Flash Thinking Experimental, aby se dále zlepšil výkon kombinací rychlosti Flash s vylepšenými schopnostmi odvozování. Minulý týden,…

DeepSeek TOP17 Nejlepší alternativy: Komplexní analýza (2025)

Nezařazené

DeepSeek TOP17 Nejlepší alternativy: Komplexní analýza (2025)

Podledeepseeker Únor 6, 2025Únor 6, 2025

Úvod V rychle se vyvíjejícím prostředí umělé inteligence se DeepSeek ukázal jako výkonný jazykový model. Tato komplexní analýza zkoumá 17 nejlepších alternativ k DeepSeek a zkoumá jejich jedinečné vlastnosti, schopnosti a případy použití. Náš výzkum se zaměřuje na mezinárodní i čínské platformy, které nabízejí integraci DeepSeek nebo podobné možnosti. Analýza top alternativ 1….

Nezařazené

Ali Qwen2.5-Max předbíhá DeepSeek-V3! Netizen: Čínská umělá inteligence rychle zmenšuje mezeru

Podlezddeepseeker Únor 5, 2025Únor 5, 2025

Právě teď přibyl na seznam Big Model Arena od Ali další tuzemský model, Qwen2.5-Max, který překonal DeepSeek-V3 a v celkovém hodnocení obsadil sedmé místo s celkovým skóre 1332. Jedním úderem překonal i modely jako Claude 3.5 Sonnet a Llama 3.1 405B. Zejména vyniká v programování…