zddeepseeker - Deepseek R1 - Seite 2 von 3

Uncategorized

DeepSeek-R1-Technologie enthüllt: Die Kernprinzipien des Papiers werden aufgeschlüsselt und der Schlüssel zur bahnbrechenden Modellleistung wird enthüllt

Vonzddeepseeker 9. Februar 20259. Februar 2025

Heute teilen wir DeepSeek R1, Titel: DeepSeek-R1: Förderung der Denkfähigkeit in LLMs durch bestärkendes Lernen: Förderung der Denkfähigkeit von LLMs durch bestärkendes Lernen. Dieses Dokument stellt die erste Generation von Denkmodellen von DeepSeek vor, DeepSeek-R1-Zero und DeepSeek-R1. Das Modell DeepSeek-R1-Zero wurde als erster Schritt durch groß angelegtes bestärkendes Lernen (RL) ohne überwachte Feinabstimmung (SFT) trainiert, …

Uncategorized

DeepSeek R1-Papierinterpretation und wichtige technische Punkte

Vonzddeepseeker 9. Februar 20259. Februar 2025

1 Hintergrund Während des Frühlingsfestes erregte DeepSeek R1 erneut große Aufmerksamkeit, und sogar der Interpretationsartikel zu DeepSeek V3, den wir zuvor geschrieben hatten, wurde erneut gesendet und viel diskutiert. Obwohl es viele Analysen und Reproduktionen von DeepSeek R1 gab, haben wir uns hier entschieden, einige entsprechende Lesehinweise zusammenzustellen. Wir werden drei verwenden…

Googles Low-Cost-Modell Gemini 2.0-Serie greift an: Der Kampf um die Kosteneffizienz bei großen Modellen verschärft sich

Uncategorized

Googles Low-Cost-Modell Gemini 2.0-Serie greift an: Der Kampf um die Kosteneffizienz bei großen Modellen verschärft sich

Vonzddeepseeker 8. Februar 20258. Februar 2025

Die hohen Kosten für die Verwendung großer KI-Modelle sind ein Hauptgrund dafür, dass viele KI-Anwendungen noch nicht implementiert und gefördert wurden. Die Wahl extremer Leistung bedeutet enorme Kosten für die Rechenleistung, was zu hohen Nutzungskosten führt, die normale Benutzer nicht akzeptieren können. Der Wettbewerb um große KI-Modelle ist wie ein Krieg ohne Rauch. Nach…

Gemini 2.0 dominiert die Charts, während der Preis des DeepSeek V3 sinkt. Ein neuer Champion in Sachen Kosteneffizienz ist geboren!

Uncategorized

Gemini 2.0 dominiert die Charts, während der Preis des DeepSeek V3 sinkt. Ein neuer Champion in Sachen Kosteneffizienz ist geboren!

Vonzddeepseeker 8. Februar 20258. Februar 2025

Die Google Gemini 2.0-Familie ist endlich komplett! Sie dominiert die Charts, sobald sie veröffentlicht wird. Inmitten der Verfolgung und Blockaden von Deepseek, Qwen und o3 hat Google heute früh drei Modelle auf einmal veröffentlicht: Gemini 2.0 Pro, Gemini 2.0 Flash und Gemini 2.0 Flash-Lite. In der Rangliste der großen Modelle LMSYS ist Gemini…

a16z-Dialog mit 27-jährigem CEO: AI Agent hat eine enorme Hebelwirkung und die langfristige Preisgestaltung wird an die Arbeitskosten gekoppelt sein

Uncategorized

a16z-Dialog mit 27-jährigem CEO: AI Agent hat eine enorme Hebelwirkung und die langfristige Preisgestaltung wird an die Arbeitskosten gekoppelt sein

Vonzddeepseeker 8. Februar 20258. Februar 2025

Highlights AI Agent gestaltet das Kundenerlebnis neu Jesse Zhang: Wie ist ein Agent eigentlich aufgebaut? Unserer Ansicht nach wird er mit der Zeit immer mehr einem auf natürlicher Sprache basierenden Agenten ähneln, da die großen Sprachmodelle (LLMs) auf diese Weise trainiert werden. Auf lange Sicht, wenn Sie einen superintelligenten Agenten haben, der…

Uncategorized

Cathie Wood: DeepSeek beschleunigt lediglich den Kostensenkungsprozess; die extrem konzentrierte Marktstruktur, vergleichbar mit der Großen Depression, wird sich ändern

Vonzddeepseeker 8. Februar 20258. Februar 2025

Highlights Der Wettbewerb mit DeepSeek ist gut für die USA Cathie Wood: Ich denke, es zeigt, dass die Kosten für Innovationen dramatisch sinken und dass dieser Trend bereits begonnen hat. Beispielsweise sanken vor DeepSeek die Kosten für das Training künstlicher Intelligenz um 75% pro Jahr und die Kosten für Inferenz sanken sogar um 85% auf…

Uncategorized

Google hat gleich drei neue Modelle herausgebracht: Gemini-2.0-Pro ist kostenlos, hat eine hervorragende Bewertung, belegt den ersten Platz und eignet sich zum Kodieren und Verarbeiten komplexer Eingabeaufforderungen!

Vonzddeepseeker 8. Februar 20258. Februar 2025

Die Geschichte von Gemini 2.0 nimmt Fahrt auf. Die Flash Thinking Experimental-Version im Dezember brachte Entwicklern ein funktionierendes Modell mit geringer Latenz und hoher Leistung. Anfang dieses Jahres wurde 2.0 Flash Thinking Experimental im Google AI Studio aktualisiert, um die Leistung weiter zu verbessern, indem die Geschwindigkeit von Flash mit verbesserten Inferenzfunktionen kombiniert wurde. Letzte Woche…

Uncategorized

Ali Qwen2.5-Max überholt DeepSeek-V3! Netizen: Chinas KI schließt schnell die Lücke

Vonzddeepseeker 5. Februar 20255. Februar 2025

Gerade wurde ein weiteres inländisches Modell von Ali zur Big Model Arena-Liste hinzugefügt: Qwen2.5-Max, das DeepSeek-V3 übertraf und mit einer Gesamtpunktzahl von 1332 den siebten Platz in der Gesamtwertung belegte. Es übertraf auch Modelle wie Claude 3.5 Sonnet und Llama 3.1 405B auf einen Schlag. Insbesondere zeichnet es sich durch seine Programmierfähigkeiten aus …

Aktuelle Nachrichten! DeepSeek-Forscher enthüllt online: Das R1-Training dauerte nur zwei bis drei Wochen, und während der chinesischen Neujahrsfeiertage wurde eine starke Entwicklung von R1 Null beobachtet

Uncategorized

Aktuelle Nachrichten! DeepSeek-Forscher enthüllt online: Das R1-Training dauerte nur zwei bis drei Wochen, und während der chinesischen Neujahrsfeiertage wurde eine starke Entwicklung von R1 Null beobachtet

Vonzddeepseeker 4. Februar 20254. Februar 2025

Eilmeldung! DeepSeek-Forscher enthüllt online: Das R1-Training dauerte nur zwei bis drei Wochen, und während der chinesischen Neujahrsfeiertage wurde eine starke Entwicklung von R1 Zero beobachtet. Gerade eben haben wir bemerkt, dass DeepSeek-Forscher Daya Guo auf Fragen von Internetnutzern zu DeepSeek R1 und den Zukunftsplänen des Unternehmens geantwortet hat. Wir können nur sagen …

DeepSeek R1 belegte den ersten Platz im Test zum kreativen Schreiben, und o3 mini war sogar noch schlechter als o1 mini!

Uncategorized

DeepSeek R1 belegte den ersten Platz im Test zum kreativen Schreiben, und o3 mini war sogar noch schlechter als o1 mini!

Vonzddeepseeker 3. Februar 20253. Februar 2025

DeepSeek R1 hat den Benchmark-Test zum Schreiben von kreativen Kurzgeschichten gewonnen und damit den bisherigen Spitzenreiter Claude 3.5 Sonnet überholt! Benchmark-Test Der von dem Forscher Lech Mazur entwickelte Benchmark-Test ist kein gewöhnlicher Schreibwettbewerb. Jedes KI-Modell musste 500 Kurzgeschichten verfassen, und jede Geschichte musste auf geschickte Weise...