DeepSeek đã làm được! OpenAI thừa nhận lỗi mã nguồn đóng, lợi thế tiên phong trở nên nhỏ hơn

Sau đó OpenAI đã phát hành mô hình o3-mini, Tổng giám đốc điều hành Sam Altman, Giám đốc nghiên cứu Mark Chen, Giám đốc sản phẩm Kevin Weil;

Phó chủ tịch kỹ thuật Srinivas Narayanan, Trưởng phòng nghiên cứu API Michelle Pokrass và Trưởng phòng nghiên cứu Hongyu Ren đã thực hiện buổi hỏi đáp kỹ thuật trực tuyến trên reddit, một trong những diễn đàn toàn diện lớn nhất thế giới.

Các chủ đề chính được thảo luận là tình hình hiện tại của OpenAI, kế hoạch sản phẩm trong tương lai và hiện tượng toàn cầu của mô hình lớn DeepSeek-R1.

Những câu hỏi hay nhất

Một người dùng hỏi: “Chúng ta có thể thấy tất cả các mã thông báo suy nghĩ của mô hình lớn không?”

Sam Altman: ”Vâng, chúng tôi sẽ sớm cho ra mắt phiên bản hữu ích và chi tiết hơn. Điều này là nhờ bản cập nhật TRONG R1.

Kevin Weil: Chúng tôi đang nỗ lực để hiển thị nhiều hơn những gì chúng tôi hiển thị ngày hôm nay – điều này sẽ sớm xảy ra. Cách chính xác để hiển thị tất cả nội dung vẫn chưa được xác định, nhưng việc hiển thị tất cả các chuỗi suy nghĩ có thể dẫn đến sự tinh chỉnh mang tính cạnh tranh.

Nhưng chúng tôi cũng biết rằng mọi người (ít nhất là người dùng có chuyên môn) muốn thấy điều này, vì vậy chúng tôi sẽ tìm cách phù hợp để cân bằng điều này.

Srinivas Narayanan: Chúng tôi đang tìm cách thể hiện nhiều hơn về quá trình suy nghĩ. Hãy theo dõi nhé.

Bạn có cân nhắc việc công bố một số mô hình trọng số và công bố một số nghiên cứu không?

Sam Altman: Vâng, chúng tôi đang thảo luận về vấn đề này. Tôi nghĩ chúng tôi đã chọn sai về mặt lịch sử của nguồn đóng và cần tìm ra một chiến lược nguồn mở khác. Không phải ai cũng chia sẻ quan điểm này và đây cũng không phải là ưu tiên hàng đầu của chúng tôi vào lúc này.

Chúng ta hãy nói về chủ đề nóng của tuần này, Deepseek. Rõ ràng, đây là một mô hình rất ấn tượng và tôi biết nó có thể được đào tạo dựa trên kết quả của các mô hình lớn khác. Điều này sẽ ảnh hưởng đến các kế hoạch mô hình trong tương lai của bạn như thế nào?

Sam Altman: Đây là một mô hình rất tốt! Chúng tôi sẽ phát triển các mô hình tốt hơn, nhưng khoảng cách của chúng tôi sẽ nhỏ hơn so với những năm trước.

Giả sử là năm 2030 và bạn vừa tạo ra một hệ thống trí tuệ nhân tạo (AGI) chung. Nó vượt trội ở mọi chuẩn mực bạn đặt ra, vượt trội hơn các kỹ sư và nhà nghiên cứu giỏi nhất của bạn về cả tốc độ và hiệu suất. Tiếp theo là gì? Có kế hoạch nào ngoài việc "ra mắt trên trang web" không?

Sam Altman: Theo tôi, tác động quan trọng nhất sẽ là đẩy nhanh quá trình khám phá khoa học, vì tôi tin rằng đây là yếu tố đóng góp nhiều nhất vào việc cải thiện chất lượng cuộc sống.

Srinivas Narayanan: Giao diện mà chúng ta tương tác với AI sẽ thay đổi cơ bản. AI sẽ trở nên tự chủ hơn, liên tục xử lý các nhiệm vụ và mục tiêu phức tạp cho chúng ta ở chế độ nền.

Họ sẽ chỉ liên lạc với chúng ta khi cần thiết. Robot cũng phải tiến bộ đủ để có thể thực hiện các nhiệm vụ hữu ích cho chúng ta trong thế giới thực. (Đánh giá từ câu trả lời này, AI Agent thực sự là một trong những trường hợp sử dụng tốt nhất cho AGI.)

Khả năng hội thoại bằng giọng nói nâng cao rõ ràng đã giảm kể từ khi tính năng video được phát hành. Có kế hoạch nào để sửa hoặc cải thiện điều này không?

Srinivas Narayanan: Cảm ơn phản hồi của bạn, chúng tôi sẽ xem xét.

Tại sao thời hạn kiến thức cho o3 – nhỏ vẫn là tháng 10 năm 2023? Điều này cũng đúng với o3 hoặc o3 Pro không? Có kế hoạch nào để cập nhật thời hạn kiến thức không?

Trước khi tôi trả tiền cho gói đăng ký Plus, thời hạn nộp kiến thức cho GPT – 4o là tháng 6 năm 2024, nhưng bây giờ tôi đã trả tiền, thời hạn nộp kiến thức đã lùi lại đến tháng 10 năm 2023. Tại sao lại như vậy?

Sam Altman: Bây giờ chúng tôi đã bật chức năng tìm kiếm, điều này (ngày hết hạn kiến thức) ít quan trọng hơn. Cá nhân tôi sẽ không bao giờ nghĩ về ngày hết hạn kiến thức nữa

Chúng ta có thể mong đợi những tác nhân AI nào khác?

Tạo một tác nhân cho người dùng miễn phí để đẩy nhanh quá trình triển khai.

Có tin tức gì về phiên bản mới của DALL-E không?

Và cuối cùng, câu hỏi mà mọi người đều hỏi… khi nào thì đạt được AGI?

Kevin Weil: Sẽ sớm có thêm nhiều tác nhân được phát hành và tôi nghĩ bạn sẽ hài lòng với chúng. Việc tạo hình ảnh dựa trên 4o sẽ diễn ra trong vài tháng nữa và tôi rất mong được giới thiệu với bạn. Thật tuyệt vời.

AGI sẽ xảy ra.

Liệu có cải tiến lớn nào cho GPT-4o không? Tôi thực sự thích GPT tùy chỉnh và sẽ thật tuyệt nếu nó có thể được nâng cấp hoặc nếu chúng ta có thể chọn mô hình nào để sử dụng trên GPT tùy chỉnh (ví dụ: o3 mini).

Michelle Pokrass: Vâng, chúng tôi vẫn chưa kết thúc series 40!

Có bản cập nhật nào cho chế độ giọng nói nâng cao không? Đây có phải là trọng tâm của GPT-5o không?

Sam Altman: Có, sẽ có bản cập nhật cho chế độ giọng nói nâng cao!

Chúng tôi sẽ gọi là GPT-5, không phải GPT-5o. Hiện tại vẫn chưa có lịch trình cụ thể.

Sự thành công của Stargate quan trọng như thế nào đối với tương lai của OpenAI?

Kevin Weil: Rất quan trọng. Mọi thứ chúng ta thấy đều cho thấy rằng chúng ta càng có nhiều sức mạnh tính toán thì chúng ta càng có thể xây dựng các mô hình tốt hơn và tạo ra nhiều sản phẩm có giá trị hơn. Hiện tại, chúng ta đang mở rộng quy mô các mô hình theo hai chiều cùng một lúc – tiền huấn luyện lớn hơn và học tăng cường (RL) / "dâu tây" (có thể là một loại công nghệ hoặc tên mã dự án) – và cả hai đều yêu cầu sức mạnh tính toán.

Cũng như việc cung cấp sản phẩm cho hàng trăm triệu người dùng! Và nó đòi hỏi sức mạnh tính toán khi chúng ta hướng tới các sản phẩm thông minh hơn có thể hoạt động liên tục cho người dùng. Vì vậy, hãy nghĩ về Stargate như nhà máy của chúng ta biến điện hoặc GPU thành những sản phẩm tuyệt vời.

DeepSeek đã làm được! OpenAI thừa nhận lỗi mã nguồn đóng, lợi thế dẫn đầu trở nên nhỏ hơn

Những câu hỏi hay nhất

cuộc đối thoại a16z với CEO 27 tuổi: AI Agent có tác dụng đòn bẩy rất lớn và giá cả dài hạn sẽ gắn liền với chi phí lao động

Diễn giải bài báo DeepSeek R1 & các điểm kỹ thuật chính

Paper-DeepSeek-R1: Khuyến khích khả năng lý luận trong LLM thông qua học tăng cường

Le Chat đứng đầu bảng xếp hạng, với khoản đầu tư lên tới hàng trăm tỷ đô la. Sau Hoa Kỳ và Trung Quốc, liệu đây có phải là cường quốc AI thứ ba không?

Bí mật đằng sau DeepSeek 1 | DeepSeekMath và chi tiết GRPO

OpenAI o3-mini so với DeepSeek-R1: Ai là vua của thế hệ mô hình AI mới?

Để lại một bình luận Hủy

Những câu hỏi hay nhất

Bài viết tương tự

Để lại một bình luận Hủy