zddeepseeker - Deepseek R1

A négy legjobb modell leszámolása! Egy teszt bemutatja, milyen erős a Deepseek R1

A általzddeepseeker 2025. június 1.2025. június 1.

Az elmúlt napokban a Deepseek-R1 0528 hivatalosan is nyílt forráskódúvá vált. A LiveCodeBench-en a teljesítménye majdnem megegyezik az OpenAI o3-as (magas) szintjével; az Aider többnyelvű benchmark tesztjében Claude Opusszal vetekszik. Amikor a hivatalos weboldalon megjelent, gyorsan teszteltük a front-end képességeit, és kivételesen…

Nem kategorizált

DeepSeek-R1-0528 Frissítés: Mélyebb gondolkodás, erősebb érvelés

A általzddeepseeker 2025. május 29.2025. május 29.

Az DeepSeek R1 modell kisebb verziófrissítésen esett át, a jelenlegi verzió az DeepSeek-R1-0528. Amikor belép az DeepSeek weboldalára vagy alkalmazásába, engedélyezze a „Mély gondolkodás” funkciót a párbeszédpanelen a legújabb verzió megismeréséhez. Az DeepSeek-R1-0528 modell súlyait feltöltöttük a HuggingFace-re. Az elmúlt négy hónapban az DeepSeek-R1…

Nem kategorizált

Az DeepSeek kiadta forráskódját, a FlashMLA részletes magyarázatát

A általzddeepseeker 2025. február 242025. február 24

Múlt héten az DeepSeek bejelentette, hogy a jövő héten öt projektet nyit meg a forráskóddal: A Netizens azt mondta: „Ezúttal valóban itt van az OpenAI.” Most érkezett meg az első nyílt forráskódú projekt, a következtetések gyorsításával kapcsolatban, FlashMLA: Nyílt forráskódú projekt címe: DeepSeek FlashMLA Két órája nyílt forráskódú, és a Githubnak már több mint 2,7 ezer csillaga van: A…

Nem kategorizált

Qwen2.5-max vs DeepSeek R1: A modellek alapos összehasonlítása: az alkalmazási forgatókönyvek teljes elemzése

A általzddeepseeker 2025. február 142025. február 14

Bevezetés Manapság a nagy nyelvi modellek (LLM-ek) döntő szerepet játszanak. 2025 elején, ahogy a mesterséges intelligenciaért folytatott verseny fokozódott, az Alibaba piacra dobta az új Qwen2.5-max AI modellt, a kínai Hangzhou-i DeepSeek pedig az R1 modellt, amely az LLM technológia csúcsát képviseli. A Deepseek R1 egy nyílt forráskódú AI-modell, amely vonzotta…

Nem kategorizált

Közel áll az DeepSeek-R1-32B-hez, és összetöri Fei-Fei Li s1-ét! UC Berkeley és más nyílt forráskódú új SOTA következtetési modellek

A általzddeepseeker 2025. február 142025. február 14

A 32B következtetési modell csak az adatok 1/8-át használja fel, és az azonos méretű DeepSeek-R1-hez kötődik! Az imént olyan intézmények, mint a Stanford, a UC Berkeley és a Washingtoni Egyetem közösen kiadtak egy SOTA-szintű következtetési modellt, az OpenThinker-32B-t, és nyílt forráskódú akár 114 000 képzési adatokat is. OpenThinker Project honlapja: OpenThinker Hugging Face:…

Nem kategorizált

Nagy nyelvi modell-kezelési műtermékek, például DeepSeek: Cherry Studio, Chatbox, AnythingLLM, ki az Ön hatékonysággyorsítója?

A általzddeepseeker 2025. február 112025. február 11

Sokan már elkezdték helyileg telepíteni és használni a Deepseek Large Language Models-t, a Chatboxot vizualizációs eszközként használva. Ez a cikk továbbra is két másik AI Large Language Model kezelési és vizualizációs műterméket mutat be, és a hármat részletesen összehasonlítja az AI Large Language Models hatékonyabb használatának elősegítése érdekében. 2025-ben…

Nem kategorizált

A slágerlisták élén a Le Chat áll, százmilliárd dolláros befektetésével. Az Egyesült Államok és Kína után ez a harmadik AI-hatalom?

A általzddeepseeker 2025. február 112025. február 11

Február 9-én Emmanuel Macron francia elnök bejelentette, hogy Franciaország 109 milliárd eurót (113 milliárd dollárt) fektet be a mesterséges intelligencia területére a következő néhány évben. Ezt a beruházást egy MI-park felépítésére, az infrastruktúra fejlesztésére és helyi induló mesterségesintelligencia-vállalkozásokba való befektetésre fordítják. Eközben a Mistral, egy francia startup,…

Nem kategorizált

Mit érhet el a Deepseek? Még az OpenAI sem képes rá?

A általzddeepseeker 2025. február 102025. február 10

Az DeepSeek valódi értékét alábecsülik! Az DeepSeek-R1 kétségtelenül a lelkesedés új hullámát hozta a piacra. Nemcsak a releváns, úgynevezett kedvezményezettek száma emelkedik meredeken, de néhányan még az DeepSeek-vel kapcsolatos tanfolyamokat és szoftvereket is kifejlesztették, hogy ezzel pénzt keressenek. Úgy gondoljuk, hogy bár ezeknek a jelenségeknek van…

Nem kategorizált

A világ fő AI-termékei az elemzésre és az átfogó felhasználói élményre összpontosítanak (beleértve az DeepSeek-t és a GPT-t)

A általzddeepseeker 2025. február 102025. február 10

Funkciópozicionálás és alapvető előnyök elemzése ChatGPT (OpenAI) – a mindenre kiterjedő globális benchmark ChatGPT Technikai gének: generatív mesterséges intelligencia, amely a nagy modellek GPT sorozatán alapul, általános társalgási készségekkel és logikus érveléssel, mint fő előnye. Többnyelvű feldolgozás: a legjobban angolul teljesít, a kínai nyelv folyamatos fejlesztésével; de javasoljuk, hogy az angol nyelvet használja…

Nem kategorizált

Az DeepSeek 1 titka | DeepSeekMath és GRPO részletek

A általzddeepseeker 2025. február 92025. február 9

Ma szeretnék megosztani egy cikket az DeepSeek-től, melynek címe DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Ez a cikk bemutatja az DeepSeekMath 7B-t, amely az DeepSeek-Coder-Base-v1.5 7B-re van előképzett, 120B matematikai tokenek, természetes nyelvi és kódadatok gyűjteménye alapján. A modell elképesztő, 51,7% pontszámot ért el versenyszinten…