Altman: Chúng ta đã sai về AI nguồn mở! DeepSeek đã khiến OpenAI kém lợi thế hơn và cái tiếp theo là GPT-5

o3-mini đã đến muộn vào ban đêm và OpenAI cuối cùng đã tiết lộ quân bài chủ mới nhất của mình. Trong buổi hỏi đáp AMA trên Reddit, Altman đã thú nhận sâu sắc rằng ông đã đứng sai phía của AI nguồn mở.

Ông cho biết chiến lược nội bộ về nguồn mở đang được cân nhắc và mô hình sẽ tiếp tục được phát triển, nhưng lợi thế dẫn đầu của OpenAI sẽ không còn lớn như trước.

Trong khi mọi người vẫn đang kinh ngạc trước sức mạnh đáng kinh ngạc của DeepSeek, OpenAI cuối cùng cũng không thể ngồi yên được nữa.

Sáng sớm ngày hôm qua, o3-mini đã được ra mắt khẩn cấp, thiết lập SOTA mới trong các bài kiểm tra chuẩn như mã toán học và trở lại ngôi vương.

Điều quan trọng nhất là người dùng miễn phí cũng có thể trải nghiệm! o3-mini không phải là trò đùa. Trong “kỳ thi cuối cùng dành cho con người”, o3-mini (cao) đã trực tiếp đạt được độ chính xác và lỗi hiệu chuẩn tốt nhất.

Vài giờ sau o3-mini đã trực tuyếnOpenAI chính thức mở buổi AMA trên Reddit trong khoảng một giờ.

Bản thân Altman cũng đã lên mạng và trả lời mọi câu hỏi của cư dân mạng.

Những điểm nổi bật chính là:

DeepSeek thực sự rất tốtvà chúng tôi sẽ tiếp tục phát triển các mô hình tốt hơn, nhưng khoảng cách sẽ không lớn như trước
So với vài năm trước, giờ đây tôi có xu hướng tin rằng AI có thể có những bước tiến vượt bậc
Chúng ta đang ở phía sai lầm của vấn đề về việc cung cấp mã nguồn mở các mô hình AI có trọng số
Bản cập nhật cho chế độ giọng nói nâng cao sẽ sớm ra mắt và chúng tôi sẽ gọi trực tiếp là GPT-5, không phải GPT-5o. Hiện vẫn chưa có thời gian biểu cụ thể.

Ngoài Altman, Giám đốc nghiên cứu Mark Chen, Giám đốc sản phẩm Kevin Weil, Phó chủ tịch kỹ thuật Srinivas Narayanan, Trưởng phòng nghiên cứu API Michelle Pokrass và Trưởng phòng nghiên cứu Hongyu Ren cũng trực tuyến và trả lời cẩn thận mọi câu hỏi của cư dân mạng.

Tiếp theo, chúng ta hãy xem họ đã nói gì.

Mục lục

Altman vô cùng hối hận khi đứng về phía sai lầm trong cuộc chiến AI nguồn mở

Sự trở lại đột ngột của DeepSeek có thể là điều bất ngờ đối với mọi người.

Trong buổi hỏi đáp AMA, bản thân Altman cũng đã vô cùng hối hận vì đã đứng sai phe trong cuộc chiến AI nguồn mở và phải thừa nhận những lợi thế mạnh mẽ của DeepSeek.

Điều khiến nhiều người ngạc nhiên là Altman thậm chí còn nói rằng vị thế dẫn đầu của OpenAI không còn mạnh như trước nữa.

Sau đây là tất cả các câu trả lời kinh điển mà chúng tôi đã tổng hợp từ Altman.

H: Chúng ta hãy nói về chủ đề lớn của tuần này: Deepseek. Rõ ràng đây là một mô hình rất ấn tượng và tôi biết nó có thể được đào tạo dựa trên kết quả của các LLM khác. Điều này sẽ thay đổi kế hoạch của bạn cho các mô hình trong tương lai như thế nào?

Altman: Đây thực sự là một mô hình rất ấn tượng! Chúng tôi sẽ phát triển các mô hình tốt hơn, nhưng chúng tôi sẽ không thể duy trì được sự dẫn đầu lớn như những năm trước.

H: Bạn nghĩ quá trình tự cải thiện đệ quy sẽ là một quá trình dần dần hay đột ngột diễn ra?

Altman: Cá nhân tôi nghĩ tôi có xu hướng nghĩ rằng AI có thể tiến triển nhanh hơn so với vài năm trước. Có lẽ đã đến lúc viết gì đó về chủ đề này…

H: Chúng ta có thể xem tất cả các mã thông báo mà mô hình nghĩ tới không?

Altman: Vâng, chúng tôi sẽ sớm cho ra mắt phiên bản hữu ích và chi tiết hơn. Cảm ơn R1 đã cập nhật.

Kevin Weil, Giám đốc sản phẩm: Chúng tôi đang nỗ lực để hiển thị nhiều hơn những gì chúng tôi đang làm hiện nay – điều này sẽ sớm xảy ra. Việc chúng tôi hiển thị mọi thứ hay không vẫn chưa được xác định. Việc hiển thị tất cả các chuỗi suy nghĩ (CoT) sẽ dẫn đến việc chưng cất mô hình của đối thủ cạnh tranh, nhưng chúng tôi cũng biết rằng người dùng (ít nhất là người dùng nâng cao) muốn thấy điều này, vì vậy chúng tôi sẽ tìm ra sự cân bằng tốt.

H: Khi nào thì phiên bản đầy đủ của o3 sẽ có sẵn?

Altman: Tôi ước tính sẽ mất hơn vài tuần, nhưng không quá vài tháng.

H: Có bản cập nhật nào cho chế độ giọng nói không? Đây có phải là trọng tâm của GPT-5o không? Mốc thời gian sơ bộ cho GPT-5o là bao lâu?

Altman: Vâng, bản cập nhật cho chế độ giọng nói nâng cao sắp ra mắt! Tôi nghĩ chúng ta sẽ chỉ gọi nó là GPT-5, không phải GPT-5o. Hiện vẫn chưa có mốc thời gian cụ thể.

H: Bạn có cân nhắc việc công bố một số mô hình trọng số và công bố một số nghiên cứu không?

Altman: Vâng, chúng tôi đang thảo luận về vấn đề này. Cá nhân tôi nghĩ rằng chúng ta đang ở phía sai của vấn đề này và cần đưa ra một chiến lược nguồn mở khác; không phải ai ở OpenAI cũng chia sẻ quan điểm này và đó không phải là ưu tiên hàng đầu của chúng tôi tại thời điểm này.

Một câu hỏi nữa:

Chúng ta đã tiến gần đến mức nào trong việc cung cấp dịch vụ Operator trong chương trình Plus thông thường?
Ưu tiên hàng đầu của khoa robot là gì?
OpenAI cảm thấy thế nào về các chip/TPU chuyên dụng hơn, như Trillium, Cerebras, v.v.? OpenAI có chú ý đến điều này không?
Những khoản đầu tư nào đang được thực hiện để phòng ngừa rủi ro trong tương lai của AGI và ASI?
Kỳ nghỉ đáng nhớ nhất của bạn là gì?

Người thay thế:

Một vài tháng
để sản xuất một con robot thực sự tốt ở quy mô nhỏ và học hỏi từ kinh nghiệm
Hiện tại, GB200 khó có thể bị đánh bại!
Một lựa chọn tốt là cải thiện trạng thái bên trong của bạn – khả năng phục hồi, thích nghi, bình tĩnh, vui vẻ, v.v.
Thật khó để lựa chọn! Nhưng hai điều đầu tiên xuất hiện trong đầu tôi là: du lịch ba lô ở Đông Nam Á hoặc đi săn ở Châu Phi

H: Các bạn có dự định tăng giá dòng Plus không?

Altman: Thực ra, tôi muốn giảm dần nó.

H: Giả sử bây giờ là năm 2030 và bạn vừa tạo ra một hệ thống mà hầu hết mọi người gọi là AGI. Nó vượt trội trong tất cả các bài kiểm tra chuẩn và vượt trội hơn các kỹ sư và nhà nghiên cứu giỏi nhất của bạn về tốc độ và hiệu suất. Tiếp theo là gì? Ngoài việc "đưa nó lên trang web và cung cấp dưới dạng dịch vụ", bạn có kế hoạch nào khác không?

Altman: Theo tôi, tác động quan trọng nhất sẽ là đẩy nhanh quá trình khám phá khoa học, tôi nghĩ đây là yếu tố đóng góp nhiều nhất vào việc cải thiện chất lượng cuộc sống.

Tạo hình ảnh 4o, sắp ra mắt

Tiếp theo, phản hồi từ các thành viên OpenAI khác đã được thêm vào.

H: Bạn có còn dự định ra mắt trình tạo hình ảnh 4o không?

Kevin Weil, Giám đốc sản phẩm: Đúng vậy! Và tôi nghĩ việc chờ đợi là xứng đáng.

H: Tuyệt! Có lịch trình cụ thể không?

Kevin Weil, Giám đốc sản phẩm: Anh đang yêu cầu tôi gặp rắc rối. Có thể là vài tháng.

Và một câu hỏi tương tự nữa.

H: Khi nào chúng ta có thể mong đợi thấy ChatGPT-5?

Kevin Weil, Giám đốc sản phẩm: Ngay sau o-17 micro và GPT-(π+1).

Và một câu hỏi khác lại nảy sinh:

Chúng ta có thể mong đợi những loại tác nhân nào khác?
Và cũng cung cấp một tác nhân cho người dùng miễn phí, điều này có thể đẩy nhanh quá trình áp dụng…
Có thông tin cập nhật nào về phiên bản mới của DALL·E không?
Một câu hỏi cuối cùng, và cũng là câu hỏi mà mọi người đều hỏi… Khi nào thì AGI sẽ được triển khai?

Kevin Weil, Giám đốc sản phẩm:

Sẽ có thêm nhiều tác nhân nữa: rất, rất sớm thôi. Tôi nghĩ bạn sẽ vui lắm.
Tạo hình ảnh dựa trên 4o: trong vài tháng nữa, tôi không thể chờ đợi để bạn sử dụng nó. Thật tuyệt.
AGI: Vâng

H: Bạn có dự định thêm chức năng đính kèm tệp vào mô hình lý luận không?

Srinivas Narayanan, Phó chủ tịch Kỹ thuật: Đang trong quá trình phát triển. Trong tương lai, mô hình lý luận sẽ có thể sử dụng các công cụ khác nhau, bao gồm cả chức năng tìm kiếm.

Kevin Weil, Giám đốc sản phẩm: Tôi chỉ muốn nói rằng tôi rất mong chờ được thấy mô hình lý luận có thể sử dụng các công cụ

H: Thật vậy. Khi bạn giải quyết vấn đề này, một số kịch bản ứng dụng AI rất hữu ích sẽ được mở ra. Hãy tưởng tượng nó có thể hiểu được nội dung của 500GB tài liệu làm việc của bạn.

Khi bạn sắp trả lời email, một bảng điều khiển sẽ mở ra bên cạnh ứng dụng email của bạn, liên tục phân tích mọi thông tin liên quan đến người này, bao gồm mối quan hệ của bạn, các chủ đề đã thảo luận, công việc trước đây, v.v. Có lẽ một số thông tin trong tài liệu mà bạn đã quên từ lâu sẽ được đánh dấu vì nó có liên quan cao đến cuộc thảo luận hiện tại. Tôi rất muốn có tính năng này.

Srinivas Narayanan, Phó chủ tịch Kỹ thuật: Chúng tôi đang nỗ lực tăng độ dài của ngữ cảnh. Hiện vẫn chưa có ngày/thông báo cụ thể.

H: Dự án Stargate quan trọng như thế nào đối với tương lai của OpenAI? Kevin Weil, Giám đốc sản phẩm: Rất quan trọng. Mọi thứ chúng ta thấy đều cho thấy rằng chúng ta càng có nhiều sức mạnh tính toán thì chúng ta càng có thể xây dựng các mô hình tốt hơn và tạo ra nhiều sản phẩm có giá trị hơn.

Hiện tại, chúng tôi đang mở rộng mô hình theo hai chiều — đào tạo trước lớn hơn và đào tạo tăng cường (RL)/“dâu tây” nhiều hơn — cả hai đều yêu cầu tài nguyên tính toán.

Phục vụ hàng trăm triệu người dùng cũng đòi hỏi tài nguyên tính toán! Và khi chúng ta hướng đến các sản phẩm đại lý thông minh hơn có thể hoạt động liên tục cho bạn, điều này cũng đòi hỏi tài nguyên tính toán. Vì vậy, bạn có thể coi Stargate như nhà máy của chúng tôi, nơi điện/GPU được chuyển đổi thành các sản phẩm tuyệt vời.

H: Về mặt nội bộ, hiện tại bạn đang sử dụng mô hình nào? o4, o5 hay o6? Những mô hình nội bộ này thông minh hơn bao nhiêu so với o3?

Michelle Pokrass, Trưởng phòng Nghiên cứu API: Chúng tôi không đếm xuể.

H: Vui lòng cho phép chúng tôi tương tác với văn bản/khung vẽ trong khi sử dụng các tính năng giọng nói nâng cao. Tôi muốn có thể nói chuyện với nó và yêu cầu nó sửa đổi tài liệu theo từng lần.

Kevin Weil, Giám đốc sản phẩm: Đúng vậy! Chúng tôi có rất nhiều công cụ tuyệt vời được phát triển tương đối độc lập – mục tiêu là đưa những công cụ đó đến tay bạn càng nhanh càng tốt.

Bước tiếp theo là tích hợp tất cả các tính năng này để bạn có thể nói chuyện với một mô hình, tìm kiếm và lý luận cùng lúc, và tạo ra một canvas có thể chạy Python. Tất cả các công cụ cần phải hoạt động tốt hơn cùng nhau. Và nhân tiện, tất cả các mô hình cần có quyền truy cập công cụ đầy đủ (các mô hình o-series hiện không thể sử dụng tất cả các công cụ), điều này cũng sẽ được triển khai.

H: Khi nào các mẫu máy dòng o sẽ hỗ trợ chức năng bộ nhớ trong ChatGPT?

Michelle Pokrass, Trưởng phòng nghiên cứu API: Đang trong quá trình phát triển! Ưu tiên hàng đầu của chúng tôi là hợp nhất tất cả các tính năng của chúng tôi với các mẫu o-series.

H: Sẽ có bất kỳ cải tiến lớn nào đối với 4o không? Tôi thực sự thích GPT tùy chỉnh và sẽ thật tuyệt nếu nó có thể được nâng cấp hoặc nếu chúng ta có thể chọn mẫu nào để sử dụng trong GPT tùy chỉnh (như o3 mini).

Michelle Pokrass, Trưởng phòng nghiên cứu API: Đúng vậy, chúng tôi vẫn chưa hoàn thành loạt bài 4o!

Altman: Chúng ta đã sai về AI nguồn mở! DeepSeek đã khiến OpenAI kém lợi thế hơn, và cái tiếp theo là GPT-5

Altman vô cùng hối hận khi đứng về phía sai lầm trong cuộc chiến AI nguồn mở

Tạo hình ảnh 4o, sắp ra mắt

Cuộc so tài của bốn mẫu máy hàng đầu! Đánh giá cho thấy sức mạnh của Deepseek R1

DeepSeek R1 đứng đầu trong bài kiểm tra viết sáng tạo, và o3 mini thậm chí còn tệ hơn o1 mini!

Google đã phát hành ba mô hình mới cùng lúc: Gemini-2.0-Pro miễn phí, có điểm số cao và xếp hạng đầu tiên, phù hợp để mã hóa và xử lý các lời nhắc phức tạp!

FlashMLA là gì? Hướng dẫn toàn diện về tác động của nó đối với AI Decoding Kernels

Tin tức mới nhất! OpenAI đã phát hành 2 mô hình suy luận mới ngày hôm nay: o3-mini và o3-mini-high.

Tin tức nóng hổi! Nhà nghiên cứu DeepSeek tiết lộ trực tuyến: Quá trình đào tạo R1 chỉ mất hai đến ba tuần và sự tiến hóa mạnh mẽ của R1 zero đã được quan sát thấy trong kỳ nghỉ Tết Nguyên đán của Trung Quốc

Để lại một bình luận Hủy

Altman vô cùng hối hận khi đứng về phía sai lầm trong cuộc chiến AI nguồn mở

Tạo hình ảnh 4o, sắp ra mắt

Bài viết tương tự

Để lại một bình luận Hủy