Az igazi értéke DeepSeek alábecsülik!
Az DeepSeek-R1 kétségtelenül a lelkesedés új hullámát hozta a piacra. Nemcsak a releváns, úgynevezett kedvezményezettek száma emelkedik meredeken, de néhányan még az DeepSeek-vel kapcsolatos tanfolyamokat és szoftvereket is kifejlesztették, hogy ezzel pénzt keressenek.
Úgy gondoljuk, hogy bár ezeknek a jelenségeknek van egy bizonyos kaotikus eleme, és tisztában kell lennünk az ezzel járó kockázatokkal, tagadhatatlan, hogy a közvélemény DeepSeek iránti kíváncsiságát és lelkesedését tükrözik.
Korábban elemeztem az DeepSeek-R1 megjelenésének jelentőségét, ma azonban szeretném részletesen taglalni a mögötte rejlő valós lehetőséget, ami az AI alkalmazások népszerűsítésének és felvirágzásának elősegítése. Stratégiai szinten mindig is hangsúlyoztam, hogy a teljesítmény javítását célzó folyamatos beruházás kulcsfontosságú.
Amikor a technológia elért egy bizonyos fejlődési fokot, a teljesítményhangolás és az energiahatékonyság kell, hogy legyen a középpontban a költségek csökkentése és a versenyképesség fokozása érdekében. Az DeepSeek azért keltett ekkora feltűnést, mert kiképzett a DeepSeek-R1 modell Az OpenAI o1 modellhez hasonló teljesítménnyel, sokkal alacsonyabb áron, mint az olyan amerikai AI-óriásoké, mint az OpenAI, a Meta és az Anthropic. Ez mindenkinek megmutatta annak lehetőségét, hogy a kínai technológiai ipar áttöri az Egyesült Államok visszaszorítását.
Ráadásul néhány évvel ezelőtt sok szakértő úgy gondolta, hogy a méretezési törvény hamarosan megbukik. A mesterséges intelligencia modellek méretének növekedésével egyre nehezebb lesz jó minőségű adatokhoz jutni, a teljesítményjavulás marginális hatása pedig fokozatosan gyengül.
Emellett a nagy mesterségesintelligencia-modellek számítási teljesítményigényének meredek növekedése is komoly energiafogyasztást és környezeti problémákat fog okozni. Emiatt az emberek úgy érzik, hogy az DeepSeek megközelítése nagy reményeket fűz a nagy mesterséges intelligencia modellek csúcsára.
Azonban továbbra is egyetértek Huang Renxun véleményével, miszerint a méretezési törvény továbbra is érvényes. A tőkeberuházás és a számítási teljesítmény növelése továbbra is folyamatosan javíthatja a modellek teljesítményét, és az ilyen jellegű fejlesztések felső határa határozottan sokkal magasabb, mint a teljesítményhangolás és az energiahatékonyság. Más szóval, ha minden optimalizálható részletet optimalizáltunk, majd tovább szeretnénk javítani a teljesítményt, akkor már csak a növekvő befektetésben bízhatunk.
Ezért hosszú távon, ha pusztán a teljesítményhangolásra hagyatkozik, nem biztos, hogy képes lépést tartani a versenytársakkal, akik folyamatosan pénzt költenek a teljesítmény javítására.
Ezért úgy gondolom, hogy továbbra is hideg fejjel kell megvizsgálnunk az DeepSeek élvonalbeli versenyképességét. Másrészt azonban az DeepSeek tényleges értékét alábecsülték.
A vezető mesterséges intelligencia-cégek, mint például az OpenAI, rengeteg erőforrást fektettek be a modellek képzésébe és optimalizálásába, de nem oldották meg az alkalmazás problémáját, és fejlesztették az alkalmazáspiacot e modellek fejlesztésének támogatására.
A magas működési költségek, a bonyolult számítási folyamatok, valamint az adatbiztonsági és adatvédelmi problémák folyamatosan magas finanszírozási igényt eredményeztek, ami egyben korlátozza ezen cégek további terjeszkedését és alkalmazását az AI területén.
Meg tudja oldani ezt a problémát az DeepSeek? Ez megköveteli a alapos betekintés a nyílt forráskód és a zárt forráskód közötti kényes egyensúlyba, a teljesítmény javításába és a piaci alkalmazásba.
Egyrészt az DeepSeek nyílt forráskódú megközelítése eltér a többi modelltől.
A nyílt forráskód hagyományos értelemben azt jelenti, hogy a kód teljesen nyílt, és azt bárki szabadon használhatja, módosíthatja, terjesztheti, míg a nyílt forráskódú fejlesztő nem profitál belőle. Az AI területén azonban a nyílt forráskód nem csak a kód megnyitásáról szól, hanem ami még fontosabb, a modellképzésről és az optimalizálásról.
Az DeepSeek nyilvánossá teszi a modellstruktúrát, és teljesen betanított és optimalizált nyílt forráskódú modelleket biztosít, ami nem csak a felhasználók küszöbét csökkenti, hanem a modell teljesítményét is biztosítja. Ugyanakkor az DeepSeek online szolgáltatásokon keresztül folyamatosan gyűjti a felhasználói visszajelzéseket és adatokat a modell teljesítményének folyamatos optimalizálása érdekében.
A jövőben akár a modellparaméterek valós időben történő módosítására is lehetőség nyílik a felhasználói használat alapján, ezáltal hatékonyabb és személyre szabottabb szolgáltatásokat nyújtva.
A jövőben a Metához hasonlóan az DeepSeek nyílt forráskódú stratégiája is vonzza majd a fejlesztőket és kutatókat a világ minden tájáról, hogy részt vegyenek a részvételben, egy nagyobb együttműködési ökoszisztémát alkotva. Ez az együttműködési modell nagymértékben elősegíti az AI technológia innovációját és alkalmazását. Ugyanakkor az DeepSeek több technikai támogatást és üzleti lehetőséget is kap az együttműködésből, így mindenki számára előnyös helyzet alakul ki.
Másrészt az DeepSeek várhatóan megoldja az inkluzivitás problémáját a jelenlegi mesterséges intelligencia alkalmazási folyamatban. Jelenleg sok mesterségesintelligencia-alkalmazásokkal foglalkozó vállalat már jelentős bevételt ért el, ami azt mutatja, hogy az AI-technológia már eléggé kiforrott.
Például a Palantir, amelynek részvényeinek árfolyama a közelmúltban az egekbe szökött, nagymértékben javította működési hatékonyságát és ezáltal haszonkulcsát saját AI platform kiépítésével. Nemcsak a negyedik negyedéves bevétele érte el a 800 millió amerikai dollárt, ami messze meghaladja a piaci várakozásokat és sokakat sokkolt, de a felhasználók száma is jelentősen, 43%-vel nőtt.
Úgy tűnik azonban, hogy ezek a sikerek továbbra is csak a nagy szoftvervállalatoké. Ha a kisebb cégeket és magánszemélyeket nézzük, a vállalkozók és startupok lehetőségei továbbra is korlátozottak.
Az DeepSeek megjelenése áttörte ezt a holtpontot. Az innovatív architektúra és képzési módszerek révén az DeepSeek sikeresen csökkentette az AI-modellek fejlesztésének és használatának költségeit, lehetővé téve, hogy több ember próbálja ki és használja az AI-technológiát. Ez a megközelítés nemcsak az AI-technológia népszerűsítését segíti elő, hanem új alkalmazási forgatókönyvek és igények felfedezésében is segít.
Számos cég fejlesztett már ki olcsó alkalmazásokat az DeepSeek nyílt forráskódú modelljeit használva, ami tovább bizonyítja az DeepSeek modell megvalósíthatóságát és kereskedelmi értékét. Továbbra is több új felfedezés vagy alkalmazás jelenhet meg az DeepSeek fejlesztésével, miközben a nyílt forráskódú modell több felhasználó számára teszi lehetővé a helyi telepítés megvalósítását, tovább foglalkozva ezzel az adatbiztonság kérdésével.
A jövőben az alacsony költségű, nagy teljesítményű AI-megoldások megjelenésével egyre többen kezdik el használni az AI-technológiát, és folyamatosan új igények és alkalmazási forgatókönyvek jelennek meg, ezzel is elősegítve a teljes mesterségesintelligencia-ipar fejlődését.Legyen szó akár az AI-ügynökről, akár a párosról több távoli jövő, az AI fejlődése soha nem fog megállni.
Összefoglalva, az DeepSeek elősegíti néhány új trend megjelenését a jelenlegi AI-iparban, vagyis az általános célú technológiák fejlesztése beérett, és a támogató technológiák fejlesztése, valamint a technológiák alkalmazása és kereskedelmi forgalomba hozatala még fontosabbá válik.
A jövőben a multimodális technológiák fejlődésével és az alkalmazási forgatókönyvek folyamatos bővülésével az AI-technológia egyre több területen kap fontos szerepet, és több fejlesztési lehetőséget és teret biztosít a feltörekvő mesterséges intelligencia-cégek számára, mint például az DeepSeek.