Prawdziwa wartość DeepSeek jest niedoceniany!
DeepSeek-R1 niewątpliwie wywołał nową falę entuzjazmu na rynku. Nie tylko liczba odpowiednich, tak zwanych celów beneficjentów gwałtownie rośnie, ale niektórzy ludzie opracowali nawet kursy i oprogramowanie związane z DeepSeek, próbując na tym zarobić.
Uważamy, że chociaż zjawiska te mają w sobie pewien element chaosu i musimy być świadomi związanego z nimi ryzyka, nie da się zaprzeczyć, że odzwierciedlają one ciekawość społeczeństwa i entuzjazm wobec DeepSeek.
Wcześniej analizowałem znaczenie pojawienia się DeepSeek-R1, ale dziś chciałbym szczegółowo omówić prawdziwą szansę, która za tym stoi, a mianowicie promowanie popularyzacji i dobrobytu aplikacji AI. Na poziomie strategicznym zawsze podkreślałem, że ciągłe inwestycje w celu poprawy wydajności są kluczowe.
Gdy technologia osiągnie pewien etap rozwoju, nacisk należy położyć na dostrajanie wydajności i energooszczędność, aby obniżyć koszty i zwiększyć konkurencyjność. DeepSeek wywołał tak duże poruszenie, ponieważ wyszkolił Modele DeepSeek-R1 z wydajnością porównywalną z modelem OpenAI o1 przy kosztach znacznie niższych niż amerykańskich gigantów AI, takich jak OpenAI, Meta i Anthropic. To pokazało wszystkim możliwość przełamania przez chiński przemysł technologiczny ograniczeń USA.
Co więcej, jakiś czas temu wielu ekspertów uważało, że prawo skalowania jest bliskie porażki. Wraz ze wzrostem rozmiaru modeli AI coraz trudniej będzie uzyskać wysokiej jakości dane, a marginalny efekt poprawy wydajności będzie stopniowo słabł.
Ponadto gwałtowny wzrost zapotrzebowania na moc obliczeniową dla dużych modeli AI przyniesie również poważne problemy z zużyciem energii i ochroną środowiska. To sprawia, że ludzie czują, że podejście DeepSeek ma duże nadzieje na osiągnięcie szczytu dużych modeli AI.
Nadal jednak zgadzam się ze stanowiskiem Huang Renxuna, że prawo skalowania jest nadal ważne. Zwiększenie inwestycji w kapitał i moc obliczeniową może nadal stale poprawiać wydajność modelu, a pułap tego rodzaju ulepszeń jest zdecydowanie znacznie wyższy niż dostrajanie wydajności i efektywność energetyczna. Innymi słowy, gdy zoptymalizowaliśmy wszystkie szczegóły, które można zoptymalizować, a następnie chcemy dalej poprawiać wydajność, możemy polegać tylko na zwiększaniu inwestycji.
Dlatego też, w dłuższej perspektywie, poleganie wyłącznie na dostrajaniu wydajności może nie być opłacalne w porównaniu z konkurencją, która stale inwestuje w poprawę wydajności.
Dlatego uważam, że nadal musimy trzeźwo oceniać konkurencyjność DeepSeek. Z drugiej jednak strony, rzeczywista wartość DeepSeek może być niedoszacowana.
Wiodące firmy zajmujące się sztuczną inteligencją, takie jak OpenAI, zainwestowały wiele zasobów w szkolenie i optymalizację modeli, ale nie rozwiązały problemu zastosowań i nie stworzyły rynku aplikacji, który wspierałby rozwój tych modeli.
Wysokie koszty operacyjne, złożone procesy obliczeniowe oraz problemy związane z bezpieczeństwem i prywatnością danych skutkują stale rosnącym zapotrzebowaniem na finansowanie, co dodatkowo ogranicza dalszą ekspansję i zastosowania tych firm w dziedzinie sztucznej inteligencji.
Czy DeepSeek może rozwiązać ten problem? Wymaga to a wnikliwa analiza delikatnej równowagi pomiędzy oprogramowaniem typu open source i closed source, poprawą wydajności i zastosowaniem rynkowym.
Z jednej strony podejście open source zastosowane w DeepSeek różni się od podejścia zastosowanego w innych modelach.
W tradycyjnym rozumieniu open source oznacza, że kod jest całkowicie otwarty i każdy może go swobodnie używać, modyfikować i rozpowszechniać, podczas gdy twórca open source nie może czerpać z niego korzyści. Jednak w dziedzinie AI open source nie polega tylko na otwieraniu kodu, ale co ważniejsze, na szkoleniu i optymalizacji modeli.
DeepSeek upublicznia strukturę modelu i udostępnia modele open source, które zostały w pełni wyszkolone i zoptymalizowane, co nie tylko obniża próg dla użytkowników, ale także zapewnia wydajność modelu. Jednocześnie DeepSeek stale zbiera opinie użytkowników i dane za pośrednictwem usług online, aby stale optymalizować wydajność modelu.
W przyszłości możliwe będzie nawet dostosowywanie parametrów modelu w czasie rzeczywistym na podstawie sposobu korzystania z niego przez użytkownika, co przełoży się na zapewnienie bardziej wydajnych i spersonalizowanych usług.
Podobnie jak w przypadku Meta, strategia open source DeepSeek przyciągnie w przyszłości także programistów i badaczy z całego świata, tworząc w ten sposób większy ekosystem współpracy. Ten model współpracy będzie w dużym stopniu promował innowacyjność i zastosowanie technologii AI. Jednocześnie DeepSeek zyska więcej wsparcia technicznego i możliwości biznesowych dzięki tej współpracy, osiągając sytuację korzystną dla obu stron.
Z drugiej strony oczekuje się, że DeepSeek rozwiąże problem inkluzywności w obecnym procesie stosowania sztucznej inteligencji. Obecnie wiele firm zajmujących się zastosowaniami sztucznej inteligencji osiągnęło już znaczne przychody, co pokazuje, że technologia sztucznej inteligencji jest już wystarczająco dojrzała.
Na przykład Palantir, którego cena akcji ostatnio gwałtownie wzrosła, znacznie poprawił swoją wydajność operacyjną, a tym samym marże zysku, budując własną platformę AI. Nie tylko jego przychody w czwartym kwartale osiągnęły 800 milionów dolarów amerykańskich, znacznie przekraczając oczekiwania rynku i szokując wiele osób, ale liczba użytkowników również znacznie wzrosła o 43%.
Jednak te sukcesy nadal wydają się należeć tylko do dużych firm programistycznych. Kiedy patrzymy na mniejsze firmy i osoby, możliwości dla przedsiębiorców i startupów są nadal ograniczone.
Pojawienie się DeepSeek przełamało ten impas. Dzięki innowacyjnej architekturze i metodom szkoleniowym DeepSeek skutecznie obniżyło koszty opracowywania i używania modeli AI, umożliwiając większej liczbie osób wypróbowanie i używanie technologii AI. To podejście nie tylko będzie promować popularyzację technologii AI, ale także pomoże odkryć nowe scenariusze zastosowań i potrzeby.
Wiele firm opracowało już niedrogie aplikacje przy użyciu modeli open source DeepSeek, co dodatkowo dowodzi wykonalności i wartości komercyjnej modelu DeepSeek. Więcej nowych odkryć lub aplikacji może nadal pojawiać się w miarę rozwoju DeepSeek, podczas gdy model open source pozwala większej liczbie użytkowników na implementację lokalnego wdrożenia, co dodatkowo rozwiązuje problem bezpieczeństwa danych.
W przyszłości, wraz z pojawieniem się niedrogich i wydajnych rozwiązań z zakresu sztucznej inteligencji (AI), coraz więcej osób zacznie korzystać z technologii AI, a nowe potrzeby i scenariusze zastosowań będą się nadal pojawiać, co będzie sprzyjać rozwojowi całej branży AI.Niezależnie od tego, czy jest to agent AI, czy nawet więcej w odległej przyszłości rozwój sztucznej inteligencji nigdy się nie zatrzyma.
Podsumowując, DeepSeek pomoże w promowaniu pojawienia się nowych trendów w obecnej branży sztucznej inteligencji, tzn. rozwój technologii ogólnego przeznaczenia dojrzał, a rozwój technologii pomocniczych oraz stosowanie i komercjalizacja technologii staną się jeszcze ważniejsze.
W przyszłości, dzięki rozwojowi technologii multimodalnych i ciągłej ekspansji scenariuszy zastosowań, technologia sztucznej inteligencji będzie odgrywać ważną rolę w większej liczbie dziedzin, a także zapewni więcej możliwości rozwoju i przestrzeni dla powstających firm zajmujących się sztuczną inteligencją, takich jak DeepSeek.