Nincs kategorizálva - Deepseek R1

Az DeepSeek 1 titka | DeepSeekMath és GRPO részletek

Nem kategorizált

Az DeepSeek 1 titka | DeepSeekMath és GRPO részletek

A általzddeepseeker 2025. február 92025. február 9

Ma szeretnék megosztani egy cikket az DeepSeek-től, melynek címe DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Ez a cikk bemutatja az DeepSeekMath 7B-t, amely az DeepSeek-Coder-Base-v1.5 7B-re van előképzett, 120B matematikai tokenek, természetes nyelvi és kódadatok gyűjteménye alapján. A modell elképesztő, 51,7% pontszámot ért el versenyszinten…

Nem kategorizált

Felfedték az DeepSeek-R1 technológiát: a papír alapelvei lebontásra kerülnek, és kiderül az áttörő modell teljesítményének kulcsa

A általzddeepseeker 2025. február 92025. február 9

Ma megosztjuk az DeepSeek R1-t, címe: DeepSeek-R1: Az LLM-ek érvelési képességének ösztönzése megerősítéses tanulás révén: Az LLM érvelési képességének ösztönzése megerősítő tanulás révén. Ez a cikk bemutatja az DeepSeek gondolkodási modelljeinek első generációját, az DeepSeek-R1-Zero-t és az DeepSeek-R1-et. Az DeepSeek-R1-Zero modellt kezdeti lépésként nagy léptékű megerősítéses tanulással (RL) képezték felügyelt finomhangolás (SFT) nélkül,…

Nem kategorizált

DeepSeek R1 papírértelmezés és kulcsfontosságú technikai pontok

A általzddeepseeker 2025. február 92025. február 9

1 Háttér A Tavaszi Fesztivál idején az DeepSeek R1 ismét felkeltette az érdeklődést, sőt az általunk korábban írt DeepSeek V3 interpretációs cikket is újra közvetítették és sokat vitatták. Bár az DeepSeek R1-ről számos elemzés és reprodukálás született, itt úgy döntöttünk, hogy összeállítunk néhány megfelelő feljegyzést. Három…

Támad a Google fapados modellje, a Gemini 2.0 széria: a nagy modellek költséghatékonyságáért egyre élesebb a harc

Nem kategorizált

Támad a Google fapados modellje, a Gemini 2.0 sorozat: a nagy modellek költséghatékonyságáért folytatott harc egyre élesebb

A általzddeepseeker 2025. február 82025. február 8

A nagy mesterségesintelligencia-modellek használatának magas költsége a fő oka annak, hogy sok mesterségesintelligencia-alkalmazást még nem vezettek be és nem népszerűsítettek. Az extrém teljesítmény választása hatalmas számítási energiaköltséget jelent, ami olyan magas használati költségekhez vezet, amelyeket a hétköznapi felhasználók nem tudnak elfogadni. A nagy mesterséges intelligencia modellekért folyó verseny olyan, mint egy háború füst nélkül. Után…

A Gemini 2.0 uralja a listákat, míg az DeepSeek V3 sír az árában, és új, költséghatékony bajnok született!

Nem kategorizált

A Gemini 2.0 uralja a listákat, míg az DeepSeek V3 sír az árában, és új, költséghatékony bajnok született!

A általzddeepseeker 2025. február 82025. február 8

Végre elkészült a Google Gemini 2.0 család! Megjelenésétől kezdve uralja a slágerlistákat. A Deepseek, a Qwen és az o3 üldözése és blokádjai közepette a Google ma kora reggel három modellt adott ki egyszerre: Gemini 2.0 Pro, Gemini 2.0 Flash és Gemini 2.0 Flash-Lite. A nagy modell LMSYS rangsorán a Gemini…

a16z párbeszéd a 27 éves vezérigazgatóval: Az AI Agent hatalmas kiegyenlítő hatással bír, és a hosszú távú árazás a munkaerőköltségekhez lesz kötve

Nem kategorizált

a16z párbeszéd a 27 éves vezérigazgatóval: Az AI Agent hatalmas kiegyenlítő hatással bír, és a hosszú távú árazás a munkaerőköltségekhez lesz kötve

A általzddeepseeker 2025. február 82025. február 8

Főbb jellemzők Az AI-ügynök átformálja az ügyfélélményt Jesse Zhang: Hogyan épül fel valójában egy ügynök? Az a véleményünk, hogy idővel egyre inkább egy természetes nyelv alapú ügynökhöz fog hasonlítani, mert így képezik a nagy nyelvi modelleket (LLM). Hosszú távon, ha van egy szuper intelligens ügynöke, aki…

Nem kategorizált

Cathie Wood: Az DeepSeek csak felgyorsítja a költségcsökkentési folyamatot; a nagy gazdasági világválsághoz hasonlítható extrém koncentrált piaci struktúra megváltozik

A általzddeepseeker 2025. február 82025. február 8

Fénypontok Az DeepSeek-vel folytatott verseny jót tesz az amerikai Cathie Woodnak: Szerintem ez azt mutatja, hogy az innováció költségei drámaian csökkennek, és ez a tendencia már elkezdődött. Például az DeepSeek előtt a mesterséges intelligencia képzésének költsége 75%-vel csökkent évente, és a következtetések költsége még 85%-vel is...

Nem kategorizált

A Google egyszerre három új modellt adott ki: a Gemini-2.0-Pro ingyenes, kiemelkedő pontszámmal rendelkezik és első helyen áll, valamint alkalmas összetett promptok kódolására és feldolgozására!

A általzddeepseeker 2025. február 82025. február 8

A Gemini 2.0 története felgyorsul. A decemberi Flash Thinking Experimental verzió egy működő modellt hozott a fejlesztőknek alacsony késleltetéssel és nagy teljesítménnyel. Az év elején a 2.0 Flash Thinking Experimental frissítésre került a Google AI Stúdióban, hogy a Flash sebességét a továbbfejlesztett következtetési képességekkel kombinálva tovább javítsák a teljesítményt. A múlt héten,…

DeepSeek TOP17 legjobb alternatíva: Átfogó elemzés (2025)

Nem kategorizált

DeepSeek TOP17 legjobb alternatíva: Átfogó elemzés (2025)

A általdeepseeker 2025. február 62025. február 6

Bevezetés A mesterséges intelligencia gyorsan fejlődő világában az DeepSeek erőteljes nyelvi modellként jelent meg. Ez az átfogó elemzés feltárja az DeepSeek legjobb 17 alternatíváját, megvizsgálva azok egyedi jellemzőit, képességeit és használati eseteit. Kutatásunk az DeepSeek integrációt vagy hasonló képességeket kínáló nemzetközi és kínai platformokra egyaránt összpontosít. Legjobb alternatívák elemzése 1….

Nem kategorizált

Ali Qwen2.5-Max megelőzi az DeepSeek-V3-at! Netizen: A kínai mesterséges intelligencia gyorsan csökkenti a különbséget

A általzddeepseeker 2025. február 52025. február 5

Most egy újabb hazai modell került fel a Big Model Arena listájára Alitól, a Qwen2.5-Max, amely megelőzte az DeepSeek-V3-at, és 1332 összpontszámmal a hetedik helyet szerezte meg az összesített rangsorban. Egyben megelőzte az olyan modelleket is, mint a Claude 3.5 Sonnet és a Llama 3.1 405B. Különösen a programozásban jeleskedik…