Depois de A OpenAI lançou o modelo o3-miniA empresa é composta por três diretores executivos: o CEO Sam Altman, o diretor de pesquisa Mark Chen e o diretor de produtos Kevin Weil;
O vice-presidente de engenharia Srinivas Narayanan, a diretora de pesquisa da API Michelle Pokrass e o diretor de pesquisa Hongyu Ren conduziram uma sessão de perguntas e respostas técnicas on-line no reddit, um dos maiores fóruns abrangentes do mundo.
Os principais tópicos discutidos foram a situação atual da OpenAI, o planejamento de produtos futuros e o fenômeno global do modelo grande DeepSeek-R1.
As melhores perguntas
Um usuário perguntou: "Podemos ver todos os tokens de pensamento do modelo grande?"
Sam Altman: "Sim, em breve estaremos mostrando uma versão mais útil e detalhada. Isso se deve a uma atualização em R1.
Kevin Weil: Estamos trabalhando para mostrar mais do que mostramos hoje - isso acontecerá em breve. A maneira exata de mostrar todo o conteúdo ainda não foi determinada, mas mostrar todas as cadeias de pensamento pode levar a um refinamento competitivo.
Mas também sabemos que as pessoas (pelo menos os usuários avançados) querem ver isso, portanto, encontraremos a maneira certa de equilibrar isso.
Srinivas Narayanan: Estamos procurando maneiras de mostrar mais do processo de pensamento. Fique ligado.
Você consideraria liberar alguns pesos de modelo e publicar algumas pesquisas?
Sam Altman: Sim, estamos discutindo isso. Acho que escolhemos o lado historicamente errado do código fechado e precisamos descobrir uma estratégia diferente de código aberto. Nem todos compartilham dessa opinião, e essa não é a nossa principal prioridade no momento.
Vamos falar sobre o tema quente desta semana, o Deepseek. Obviamente, esse é um modelo impressionante, e sei que ele provavelmente foi treinado com base nos resultados de outros grandes modelos. Como isso afetará seus planos de modelos futuros?
Sam Altman: É um modelo muito bom! Desenvolveremos modelos melhores, mas nossa liderança será menor do que nos anos anteriores.
Suponha que estamos em 2030 e que você acabou de criar um sistema geral de inteligência artificial (AGI). Ele é excelente em todos os parâmetros de referência que você definiu, superando seus melhores engenheiros e pesquisadores em termos de velocidade e desempenho. O que vem a seguir? Algum plano além de "lançá-lo no site"?
Sam Altman: O impacto mais importante, em minha opinião, será acelerar a descoberta científica, porque acredito que esse é o fator que mais contribuirá para melhorar a qualidade de vida.
Srinivas Narayanan: A interface por meio da qual interagimos com a IA mudará fundamentalmente. A IA se tornará mais autônoma, processando continuamente tarefas e metas complexas para nós em segundo plano.
Eles só entrarão em contato conosco quando necessário. A robótica também deve ter avançado o suficiente para ser capaz de realizar tarefas úteis para nós no mundo real. (A julgar por essa resposta, o AI Agent é de fato um dos melhores casos de uso para AGI).
Os recursos avançados de diálogo por voz aparentemente diminuíram desde que o recurso de vídeo foi lançado. Há algum plano para corrigir ou melhorar isso?
Srinivas Narayanan: Obrigado pelo feedback, vou dar uma olhada nisso.
Por que o prazo de conhecimento para a o3 - mini ainda em outubro de 2023? Esse também é o caso do o3 ou do o3 Pro? Há algum plano para atualizar o prazo de conhecimento?
Antes de eu pagar por uma assinatura Plus, o prazo de conhecimento para o GPT - 4o era junho de 2024, mas agora que paguei, o prazo de conhecimento voltou para outubro de 2023. Por que isso acontece?
Sam Altman: Agora que habilitamos a busca, isso (a data de validade do conhecimento) é menos importante. Pessoalmente, nunca mais pensarei na data de validade do conhecimento
Que outros agentes de IA podemos esperar?
Crie um agente para usuários gratuitos também, para acelerar a implementação.
Alguma notícia sobre uma nova versão de DALL-E?
E, finalmente, a pergunta que todos fazem... quando a AGI será alcançada?
Kevin Weil: Mais agentes serão lançados, em breve, e acho que você ficará feliz com eles. A geração de imagens com base no 4o está a alguns meses de distância, e mal posso esperar para mostrá-la a vocês. É realmente ótimo.
A AGI acontecerá.
Haverá grandes melhorias no GPT-4o? Gosto muito do GPT personalizado, e seria ótimo se ele pudesse ser atualizado ou se pudéssemos escolher o modelo a ser usado no GPT personalizado (por exemplo, o3 mini).
Michelle Pokrass: Sim, ainda não terminamos a série 4o!
Haverá uma atualização para o modo de voz avançado? Esse será o foco do GPT-5o?
Sam Altman: Sim, haverá uma atualização para o modo de voz avançado!
Nós o chamaremos de GPT-5, e não GPT-5o. Ainda não há um cronograma.
Qual foi a importância do sucesso do Stargate para o futuro da OpenAI?
Kevin Weil: Muito importante. Tudo o que vimos sugere que quanto mais poder de computação tivermos, melhores serão os modelos que poderemos construir e mais produtos valiosos poderemos criar. Agora estamos ampliando os modelos em duas dimensões ao mesmo tempo - maior pré-treinamento e mais aprendizagem por reforço (RL) / "strawberry" (provavelmente algum tipo de tecnologia ou nome de código de projeto) - e ambos exigem potência de computação.
O mesmo acontece com o fornecimento de produtos a centenas de milhões de usuários! E isso requer poder de computação à medida que avançamos em direção a produtos mais inteligentes que podem trabalhar para os usuários de forma contínua. Portanto, pense na Stargate como nossa fábrica que transforma eletricidade ou GPUs em excelentes produtos.