zddeepseeker - Deepseek R1 - Strana 2 z 3

Nezařazené

Technologie DeepSeek-R1 odhalena: základní principy papíru jsou rozebrány a klíč k průlomovému výkonu modelu je odhalen

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

Dnes se podělíme o DeepSeek R1, Název: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning: Incentivizing the reasoning capability of LLM through training learning. Tento článek představuje první generaci uvažovacích modelů DeepSeek, DeepSeek-R1-Zero a DeepSeek-R1. Model DeepSeek-R1-Zero byl trénován pomocí rozsáhlého učení výztuže (RL) bez doladění pod dohledem (SFT) jako počáteční krok,…

Nezařazené

Výklad papíru DeepSeek R1 a klíčové technické body

Podlezddeepseeker Únor 9, 2025Únor 9, 2025

1 Pozadí Během jarního festivalu DeepSeek R1 opět přitáhl širokou pozornost a dokonce i článek o interpretaci DeepSeek V3, který jsme dříve napsali, byl také znovu vysílán a hodně diskutován. Přestože bylo provedeno mnoho analýz a reprodukcí DeepSeek R1, rozhodli jsme se sestavit několik odpovídajících poznámek ke čtení. Použijeme tři…

Nízkonákladový model společnosti Google, řada Gemini 2.0, útočí: boj o hospodárnost u velkých modelů se přiostřuje

Nezařazené

Nízkonákladový model společnosti Google, řada Gemini 2.0, útočí: boj o hospodárnost u velkých modelů se přiostřuje

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Vysoké náklady na používání velkých modelů umělé inteligence jsou hlavním důvodem, proč mnoho aplikací umělé inteligence dosud nebylo implementováno a propagováno. Volba extrémního výkonu znamená obrovské náklady na výpočetní výkon, což vede k vysokým nákladům na používání, které běžní uživatelé nemohou akceptovat. Konkurence pro velké modely AI je jako válka bez kouře. Po…

Gemini 2.0 dominuje žebříčkům, zatímco DeepSeek V3 pláče ve své ceně a nový nákladově efektivní šampion je na světě!

Nezařazené

Gemini 2.0 dominuje žebříčkům, zatímco DeepSeek V3 pláče ve své ceně a nový nákladově efektivní šampion je na světě!

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Rodina Google Gemini 2.0 je konečně kompletní! Vévodí žebříčkům hned po vydání. Uprostřed pronásledování a blokád Deepseek, Qwen a o3 vydal Google dnes brzy ráno tři modely najednou: Gemini 2.0 Pro, Gemini 2.0 Flash a Gemini 2.0 Flash-Lite. V žebříčku velkých modelů LMSYS, Gemini…

Dialog a16z s 27letým generálním ředitelem: AI Agent má obrovský pákový efekt a dlouhodobé ceny budou spojeny s mzdovými náklady

Nezařazené

Dialog a16z s 27letým generálním ředitelem: AI Agent má obrovský pákový efekt a dlouhodobé ceny budou spojeny s mzdovými náklady

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Hlavní body AI Agent přetváří zákaznickou zkušenost Jesse Zhang: Jak je vlastně vytvořen agent? Náš názor je, že postupem času se bude stále více podobat agentovi založenému na přirozeném jazyce, protože tak se školí velké jazykové modely (LLM). Z dlouhodobého hlediska, pokud máte super inteligentního agenta, který…

Nezařazené

Cathie Wood: DeepSeek jen urychluje proces snižování nákladů; extrémně koncentrovaná tržní struktura srovnatelná s Velkou hospodářskou krizí se změní

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Hlavní body Konkurence s DeepSeek je dobrá pro americkou Cathie Wood: Myslím, že ukazuje, že náklady na inovace dramaticky klesají a že tento trend již začal. Například před DeepSeek náklady na výcvik umělé inteligence klesly o 75% ročně a náklady na odvození dokonce o 85% na…

Nezařazené

Google vydal tři nové modely najednou: Gemini-2.0-Pro je zdarma, má vynikající skóre a je na prvním místě a je vhodný pro kódování a zpracování složitých výzev!

Podlezddeepseeker Únor 8, 2025Únor 8, 2025

Příběh Gemini 2.0 se zrychluje. Prosincová verze Flash Thinking Experimental přinesla vývojářům pracovní model s nízkou latencí a vysokým výkonem. Začátkem tohoto roku byla v Google AI Studio aktualizována verze 2.0 Flash Thinking Experimental, aby se dále zlepšil výkon kombinací rychlosti Flash s vylepšenými schopnostmi odvozování. Minulý týden,…

Nezařazené

Ali Qwen2.5-Max předbíhá DeepSeek-V3! Netizen: Čínská umělá inteligence rychle zmenšuje mezeru

Podlezddeepseeker Únor 5, 2025Únor 5, 2025

Právě teď přibyl na seznam Big Model Arena od Ali další tuzemský model, Qwen2.5-Max, který překonal DeepSeek-V3 a v celkovém hodnocení obsadil sedmé místo s celkovým skóre 1332. Jedním úderem překonal i modely jako Claude 3.5 Sonnet a Llama 3.1 405B. Zejména vyniká v programování…

Nejnovější zprávy! Výzkumník DeepSeek odhaluje online: Trénink R1 trval pouze dva až tři týdny a během svátku čínského Nového roku byl pozorován silný vývoj R1 nula.

Nezařazené

Nejnovější zprávy! Výzkumník DeepSeek odhaluje online: Trénink R1 trval pouze dva až tři týdny a během svátku čínského Nového roku byl pozorován silný vývoj R1 nula.

Podlezddeepseeker Únor 4, 2025Únor 4, 2025

Nejnovější zprávy! Výzkumník DeepSeek odhaluje online: Školení R1 trvalo pouze dva až tři týdny a během svátku čínského Nového roku byl pozorován silný vývoj R1 nula Právě jsme si všimli, že výzkumník DeepSeek Daya Guo odpověděl na dotazy uživatelů o DeepSeek R1 a plánech společnosti. vpřed. Můžeme jen říci…

DeepSeek R1 se v testu tvůrčího psaní umístil na prvním místě a o3 mini byl ještě horší než o1 mini!

Nezařazené

DeepSeek R1 se v testu tvůrčího psaní umístil na prvním místě a o3 mini byl ještě horší než o1 mini!

Podlezddeepseeker Únor 3, 2025Únor 3, 2025

DeepSeek R1 zvítězil ve srovnávacím testu tvůrčího psaní povídek a úspěšně překonal předchozího dominantního hráče Claude 3.5 Sonnet! Srovnávací test Srovnávací test navržený výzkumníkem Lechem Mazurem není běžnou soutěží v psaní. Každý model umělé inteligence musel dokončit 500 krátkých povídek a do každé povídky musel chytře zakomponovat...