Nekategorizirano - Deepseek R1

Obračun četiri najbolja modela! Recenzija pokazuje koliko je Deepseek R1 moćan

Pozddeepseeker 1. lipnja 2025.1. lipnja 2025.

Tijekom proteklih nekoliko dana, Deepseek-R1 0528 je službeno postao otvorenog koda. Na LiveCodeBenchu, njegove performanse su gotovo na razini OpenAI-jevog o3 (visokog); u Aiderovom višejezičnom benchmark testu, nosi se s Claude Opusom. Kada je lansiran na službenoj web stranici, brzo smo testirali njegove mogućnosti na front-endu i otkrili da su iznimno…

Nekategorizirano

DeepSeek-R1-0528 Ažuriranje: Dublje razmišljanje, jače rasuđivanje

Pozddeepseeker 29. svibnja 2025.29. svibnja 2025.

Model DeepSeek R1 je prošao kroz manju nadogradnju verzije, a trenutna verzija je DeepSeek-R1-0528. Kada uđete na web stranicu ili aplikaciju DeepSeek, omogućite značajku "Duboko razmišljanje" u dijaloškom sučelju kako biste iskusili najnoviju verziju. Težine modela DeepSeek-R1-0528 prenesene su na HuggingFace. Tijekom protekla četiri mjeseca, DeepSeek-R1 je prošao kroz…

Nekategorizirano

DeepSeek je objavio svoj izvorni kod, detaljno objašnjenje FlashMLA

Pozddeepseeker 24. veljače 202524. veljače 2025

Prošlog je tjedna DeepSeek najavio da će sljedeći tjedan otvoriti pet projekata: Netizeni su rekli: "Ovaj put, OpenAI je stvarno ovdje." Upravo se pojavio prvi projekt otvorenog koda, povezan s ubrzanjem zaključivanja, FlashMLA: Adresa projekta otvorenog koda: DeepSeek FlashMLA Otvoreni je kod dva sata, a Github već ima 2,7k+ zvjezdica: The…

Nekategorizirano

Što je FlashMLA? Sveobuhvatni vodič o njegovom utjecaju na AI dekodiranje kernela

Podeepseeker 24. veljače 202524. veljače 2025

FlashMLA je brzo privukao pozornost u svijetu umjetne inteligencije, posebno u području velikih jezičnih modela (LLM). Ovaj inovativni alat, koji je razvio DeepSeek, služi kao optimizirana jezgra za dekodiranje dizajnirana za Hopper GPU-ove—čipove visokih performansi koji se obično koriste u AI računanjima. FlashMLA se fokusira na učinkovitu obradu sekvenci promjenjive duljine, što ga čini posebno pogodnim za...

Nekategorizirano

Qwen2.5-max protiv DeepSeek R1: Duboka usporedba modela: potpuna analiza scenarija primjene

Pozddeepseeker 14. veljače 202514. veljače 2025

Uvod Danas veliki jezični modeli (LLM) igraju presudnu ulogu. Početkom 2025. godine, kako se konkurencija za AI zaoštravala, Alibaba je lansirala novi Qwen2.5-max AI model, a DeepSeek, tvrtka iz Hangzhoua u Kini, lansirala je model R1, koji predstavlja vrhunac LLM tehnologije. Deepseek R1 je AI model otvorenog koda koji je privukao…

Nekategorizirano

Blizu je DeepSeek-R1-32B i uništava Fei-Fei Lijev s1! UC Berkeley i drugi novi modeli zaključivanja SOTA otvorenog koda

Pozddeepseeker 14. veljače 202514. veljače 2025

Model zaključivanja 32B koristi samo 1/8 podataka i povezan je s DeepSeek-R1 iste veličine! Upravo su sada institucije kao što su Stanford, UC Berkeley i Sveučilište Washington zajednički objavile model zaključivanja na razini SOTA-e, OpenThinker-32B, a također su otvorile do 114k podataka o obuci. Početna stranica projekta OpenThinker: lice koje grli OpenThinker:…

Nekategorizirano

Artefakti upravljanja velikim jezičnim modelom kao što su DeepSeek: Cherry Studio, Chatbox, AnythingLLM, tko je vaš akcelerator učinkovitosti?

Pozddeepseeker 11. veljače 202511. veljače 2025

Mnogi su ljudi već počeli implementirati i koristiti Deepseek Large Language Models lokalno, koristeći Chatbox kao alat za vizualizaciju. Ovaj će članak nastaviti predstavljati dva druga artefakta za upravljanje i vizualizaciju AI Large Language Modela i detaljno će ih usporediti kako bi vam pomogao da učinkovitije koristite AI Large Language Models. Godine 2025.…

Nekategorizirano

Le Chat je na vrhu ljestvice s ulaganjem od stotinu milijardi dolara. Nakon SAD-a i Kine, je li treća AI sila?

Pozddeepseeker 11. veljače 202511. veljače 2025

Dana 9. veljače francuski predsjednik Emmanuel Macron najavio je da će Francuska uložiti 109 milijardi eura (113 milijardi američkih dolara) u područje umjetne inteligencije u sljedećih nekoliko godina. Ovo će se ulaganje iskoristiti za izgradnju AI parka u Francuskoj, poboljšanje infrastrukture i ulaganje u lokalne novonastale tvrtke AI. U međuvremenu, Mistral, francuski startup,…

Nekategorizirano

Što Deepseek može postići? Čak ni OpenAI to ne može?

Pozddeepseeker 10. veljače 202510. veljače 2025

Prava vrijednost DeepSeek je podcijenjena! DeepSeek-R1 je bez sumnje donio novi val entuzijazma na tržište. Ne samo da relevantni takozvani ciljevi korisnika naglo rastu, već su neki ljudi čak razvili tečajeve i softver povezane s DeepSeek u pokušaju da od toga zarade. Vjerujemo da iako ovi fenomeni imaju...

Nekategorizirano

Glavni svjetski AI proizvodi usredotočeni su na analizu i sveobuhvatne smjernice za korisničko iskustvo (uključujući DeepSeek i GPT)

Pozddeepseeker 10. veljače 202510. veljače 2025

Pozicioniranje funkcija i analiza ključnih prednosti ChatGPT (OpenAI) – globalno mjerilo za svestrane ChatGPT Tehnički geni: generativni AI temeljen na GPT seriji velikih modela, s općim konverzacijskim vještinama i logičkim zaključivanjem kao temeljnim prednostima. Višejezična obrada: najbolja je na engleskom, uz kontinuirano poboljšanje na kineskom; ali preporučujemo da koristite engleski za...