zddeepseeker - Deepseek R1

Confruntarea celor mai bune patru modele! O recenzie demonstrează cât de puternic este Deepseek R1

Prinzddeepseeker 1 iunie 20251 iunie 2025

În ultimele zile, Deepseek-R1 0528 a fost oficial open-source. Pe LiveCodeBench, performanța sa este aproape la egalitate cu o3 (high) al OpenAI; în testul de referință multilingv al Aider, se compară cu Claude Opus. Când a fost lansat pe site-ul oficial, am testat rapid capacitățile sale front-end și le-am constatat a fi excepțional de...

Fără categorie

Actualizare DeepSeek-R1-0528: Gândire mai profundă, raționament mai puternic

Prinzddeepseeker 29 mai 202529 mai 2025

Modelul DeepSeek R1 a suferit o actualizare minoră, versiunea actuală fiind DeepSeek-R1-0528. Când accesați pagina web sau aplicația DeepSeek, activați funcția „Deep Thinking” din interfața de dialog pentru a experimenta cea mai recentă versiune. Ponderile modelului DeepSeek-R1-0528 au fost încărcate pe HuggingFace. În ultimele patru luni, DeepSeek-R1 a suferit...

Fără categorie

DeepSeek și-a lansat codul sursă, explicația detaliată a FlashMLA

Prinzddeepseeker 24 februarie 202524 februarie 2025

Săptămâna trecută, DeepSeek a anunțat că va deschide cinci proiecte săptămâna viitoare: Netizens a spus: „De data aceasta, OpenAI este cu adevărat aici”. Chiar acum, a venit primul proiect open source, legat de accelerarea inferenței, FlashMLA: Adresa proiectului open source: DeepSeek FlashMLA A fost open source de două ore, iar Github are deja 2.7k+ stele: The...

Fără categorie

Qwen2.5-max vs DeepSeek R1: O comparație profundă a modelelor: o analiză completă a scenariilor de aplicație

Prinzddeepseeker 14 februarie 202514 februarie 2025

Introducere Astăzi, modelele lingvistice mari (LLM) joacă un rol crucial. La începutul anului 2025, pe măsură ce competiția pentru AI s-a intensificat, Alibaba a lansat noul model Qwen2.5-max AI, iar DeepSeek, o companie din Hangzhou, China, a lansat modelul R1, care reprezintă vârful tehnologiei LLM. Deepseek R1 este un model open source AI care a atras...

Fără categorie

Este aproape de DeepSeek-R1-32B și zdrobește s1-ul lui Fei-Fei Li! UC Berkeley și alte modele noi de inferență SOTA open source

Prinzddeepseeker 14 februarie 202514 februarie 2025

Modelul de inferență 32B folosește doar 1/8 din date și este legat cu DeepSeek-R1 de aceeași dimensiune! Chiar acum, instituții precum Stanford, UC Berkeley și Universitatea din Washington au lansat în comun un model de inferență la nivel SOTA, OpenThinker-32B și, de asemenea, au furnizat open source până la 114k date de antrenament. Pagina principală a proiectului OpenThinker: OpenThinker Hugging Face:...

Fără categorie

Artefacte mari de gestionare a modelului de limbaj, cum ar fi DeepSeek: Cherry Studio, Chatbox, AnythingLLM, cine este acceleratorul tău de eficiență?

Prinzddeepseeker 11 februarie 202511 februarie 2025

Mulți oameni au început deja să implementeze și să utilizeze modelele de limbă mari Deepseek la nivel local, folosind Chatbox ca instrument de vizualizare. Acest articol va continua să prezinte alte două artefacte de gestionare și vizualizare a modelului de limbă mare AI și le va compara pe cele trei în detaliu pentru a vă ajuta să utilizați mai eficient modelele de limbă mare AI. În 2025,…

Fără categorie

Le Chat este în fruntea topurilor, cu o investiție de o sută de miliarde de dolari. După SUA și China, este a treia putere AI?

Prinzddeepseeker 11 februarie 202511 februarie 2025

Pe 9 februarie, președintele francez Emmanuel Macron a anunțat că Franța va investi 109 miliarde de euro (113 miliarde de dolari SUA) în domeniul AI în următorii câțiva ani. Această investiție va fi folosită pentru a construi un parc AI în Franța, pentru a îmbunătăți infrastructura și pentru a investi în start-up-uri locale de AI. Între timp, Mistral, un startup francez,...

Fără categorie

Ce poate realiza Deepseek? Nici măcar OpenAI nu o poate face?

Prinzddeepseeker 10 februarie 202510 februarie 2025

Valoarea adevărată a DeepSeek este subestimată! DeepSeek-R1 a adus, fără îndoială, un nou val de entuziasm pe piață. Nu numai că așa-numitele ținte relevante ale beneficiarilor cresc brusc, dar unii oameni chiar au dezvoltat cursuri și software legate de DeepSeek, în încercarea de a câștiga bani din acesta. Credem că, deși aceste fenomene au o...

Produsele de inteligență artificială de masă din lume se concentrează pe analiză și ghiduri cuprinzătoare privind experiența utilizatorului (inclusiv DeepSeek și GPT)

Fără categorie

Produsele de inteligență artificială mainstream din lume se concentrează pe analiză și ghiduri cuprinzătoare privind experiența utilizatorului (inclusiv DeepSeek și GPT)

Prinzddeepseeker 10 februarie 202510 februarie 2025

Poziționarea funcției și analiza avantajelor de bază ChatGPT (OpenAI) – punctul de referință global pentru chatGPT polivalent Gene tehnice: IA generativă bazată pe seria GPT de modele mari, cu abilități generale de conversație și raționament logic ca avantaje principale. Prelucrare multilingvă: funcționează cel mai bine în limba engleză, cu îmbunătățiri continue în chineză; dar vă recomandăm să folosiți engleza pentru...

Fără categorie

Secretul din spatele DeepSeek 1 | DeepSeekMath și detalii GRPO

Prinzddeepseeker 9 februarie 20259 februarie 2025

Astăzi aș dori să împărtășesc un articol din DeepSeek, intitulat DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. Acest articol prezintă DeepSeekMath 7B, care este pre-antrenat pe DeepSeek-Coder-Base-v1.5 7B, bazat pe o colecție de 120B de jetoane legate de matematică, limbaj natural și date de cod. Modelul a obținut un scor uimitor de 51,7% la nivel competitiv...