DeepSeek to zrobił! OpenAI przyznaje się do błędu zamkniętego źródła, przewaga lidera maleje

Po OpenAI wypuściło model o3-miniSam Altman, dyrektor ds. badań Mark Chen, dyrektor ds. produktów Kevin Weil;

Wiceprezes ds. inżynierii Srinivas Narayanan, szefowa działu badań API Michelle Pokrass i szef działu badań Hongyu Ren przeprowadzili techniczne pytania i odpowiedzi online na reddicie, jednym z największych na świecie forów.

Głównymi omawianymi tematami były obecna sytuacja OpenAI, planowanie przyszłych produktów oraz globalny fenomen dużego modelu DeepSeek-R1.

Najlepsze pytania

Jeden z użytkowników zapytał: "Czy możemy zobaczyć wszystkie myślące tokeny dużego modelu?".

Sam Altman: "Tak, wkrótce pokażemy bardziej użyteczną i szczegółową wersję. Jest to możliwe dzięki aktualizacji w R1.

Kevin Weil: Pracujemy nad tym, by pokazywać więcej niż obecnie - nastąpi to wkrótce. Dokładny sposób wyświetlania całej zawartości nie został jeszcze ustalony, ale pokazanie wszystkich łańcuchów myślowych może doprowadzić do udoskonalenia konkurencji.

Ale wiemy też, że ludzie (przynajmniej zaawansowani użytkownicy) chcą to zobaczyć, więc znajdziemy właściwy sposób, aby to zrównoważyć.

Srinivas Narayanan: Szukamy sposobów, aby pokazać więcej procesu myślowego. Bądź na bieżąco.

Czy rozważysz opublikowanie modeli wagowych i badań?

Sam Altman: Tak, dyskutujemy o tym. Myślę, że wybraliśmy historycznie złą stronę zamkniętego oprogramowania i musimy opracować inną strategię otwartego oprogramowania. Nie wszyscy podzielają ten pogląd i nie jest to obecnie nasz priorytet.

Porozmawiajmy o gorącym temacie tego tygodnia, Deepseek. Oczywiście jest to bardzo imponujący model i wiem, że prawdopodobnie został wytrenowany na podstawie wyników innych dużych modeli. Jak wpłynie to na twoje przyszłe plany dotyczące modeli?

Sam Altman: To bardzo dobry model! Opracujemy lepsze modele, ale nasza przewaga będzie mniejsza niż w poprzednich latach.

Załóżmy, że jest rok 2030 i właśnie stworzyłeś ogólny system sztucznej inteligencji (AGI). Doskonale radzi on sobie z każdym wyznaczonym testem porównawczym, przewyższając najlepszych inżynierów i badaczy zarówno pod względem szybkości, jak i wydajności. Co dalej? Jakieś plany poza "uruchomieniem go na stronie internetowej"?

Sam Altman: Moim zdaniem najważniejszym skutkiem będzie przyspieszenie odkryć naukowych, ponieważ uważam, że jest to czynnik, który w największym stopniu przyczyni się do poprawy jakości życia.

Srinivas Narayanan: Interfejs, za pośrednictwem którego wchodzimy w interakcję ze sztuczną inteligencją, zmieni się zasadniczo. Sztuczna inteligencja stanie się bardziej autonomiczna, stale przetwarzając dla nas złożone zadania i cele w tle.

Będą się z nami kontaktować tylko w razie potrzeby. Robotyka powinna być również na tyle zaawansowana, aby móc wykonywać dla nas przydatne zadania w prawdziwym świecie. (Sądząc po tej odpowiedzi, AI Agent jest rzeczywiście jednym z najlepszych przypadków użycia AGI).

Możliwości zaawansowanego dialogu głosowego najwyraźniej spadły od czasu udostępnienia funkcji wideo. Czy są jakieś plany, by to naprawić lub ulepszyć?

Srinivas Narayanan: Dzięki za opinię, przyjrzymy się temu.

Dlaczego termin wiedzy dla o3 - mini nadal październik 2023? Czy dotyczy to również o3 lub o3 Pro? Czy są jakieś plany aktualizacji terminu wiedzy?

Zanim zapłaciłem za subskrypcję Plus, termin wiedzy dla GPT - 4o przypadał na czerwiec 2024 r., Ale teraz, gdy zapłaciłem, termin wiedzy powrócił do października 2023 r. Dlaczego tak się stało?

Sam Altman: Teraz, gdy włączyliśmy wyszukiwanie, to (data wygaśnięcia wiedzy) jest mniej ważne. Osobiście nigdy więcej nie będę myślał o dacie wygaśnięcia wiedzy

Jakich innych agentów AI możemy się spodziewać?

Utwórz również agenta dla darmowych użytkowników, aby przyspieszyć wdrożenie.

Jakieś wieści na temat nowej wersji DALL-E?

I wreszcie pytanie, które wszyscy zadają... kiedy AGI zostanie osiągnięta?

Kevin Weil: Więcej agentów zostanie wydanych, już wkrótce i myślę, że będziecie z nich zadowoleni. Generowanie obrazu w oparciu o 4o potrwa około kilku miesięcy i nie mogę się doczekać, aby ci go pokazać. Jest naprawdę świetne.

AGI się wydarzy.

Czy GPT-4o doczeka się dużych ulepszeń? Naprawdę lubię niestandardowe GPT i byłoby wspaniale, gdyby można było je ulepszyć lub gdybyśmy mogli wybrać model, którego będziemy używać na niestandardowym GPT (np. o3 mini).

Michelle Pokrass: Tak, jeszcze nie skończyliśmy z serią 4o!

Czy pojawi się aktualizacja zaawansowanego trybu głosowego? Czy będzie to głównym tematem GPT-5o?

Sam Altman: Tak, będzie aktualizacja zaawansowanego trybu głosowego!

Nazwiemy go GPT-5, a nie GPT-5o. Nie ma jeszcze harmonogramu.

Jak ważny był sukces Stargate dla przyszłości OpenAI?

Kevin Weil: Bardzo ważne. Wszystko, co widzieliśmy, sugeruje, że im większą mocą obliczeniową dysponujemy, tym lepsze modele możemy budować i tym bardziej wartościowe produkty możemy tworzyć. Obecnie skalujemy modele w dwóch wymiarach jednocześnie - większe szkolenie wstępne i więcej uczenia się ze wzmocnieniem (RL) / "truskawki" (prawdopodobnie jakaś technologia lub nazwa kodowa projektu) - a oba wymagają mocy obliczeniowej.

Podobnie jak dostarczanie produktów setkom milionów użytkowników! A to wymaga mocy obliczeniowej, ponieważ zmierzamy w kierunku bardziej inteligentnych produktów, które mogą pracować dla użytkowników na bieżąco. Pomyśl więc o Stargate jako o naszej fabryce, która zamienia energię elektryczną lub procesory graficzne w świetne produkty.

Podobne posty

DeepSeek to zrobił! OpenAI przyznaje się do błędu zamkniętego źródła, przewaga lidera maleje

Najlepsze pytania

Google wypuściło jednocześnie trzy nowe modele: Gemini-2.0-Pro jest darmowy, ma znakomite wyniki i zajmuje pierwsze miejsce, a także nadaje się do kodowania i przetwarzania złożonych poleceń!

OpenAI o3-mini vs. DeepSeek-R1: Kto jest królem nowej generacji modeli AI?

Jest blisko DeepSeek-R1-32B i miażdży s1 Fei-Fei Li! UC Berkeley i inne otwarte nowe modele wnioskowania SOTA

Ali Qwen2.5-Max wyprzedza DeepSeek-V3! Internauta: Chińska sztuczna inteligencja szybko nadrabia zaległości

Tani model Google’a, seria Gemini 2.0, atakuje: walka o opłacalność w przypadku dużych modeli zaostrza się

Najnowsze wiadomości! Badacz DeepSeek ujawnia online: szkolenie R1 trwało tylko dwa do trzech tygodni, a potężną ewolucję R1 zero zaobserwowano podczas chińskiego Nowego Roku

Dodaj komentarz Anuluj pisanie odpowiedzi