Depois de A OpenAI lançou o modelo o3-miniA empresa é composta por três diretores executivos: o CEO Sam Altman, o diretor de pesquisa Mark Chen e o diretor de produtos Kevin Weil;

O vice-presidente de engenharia Srinivas Narayanan, a diretora de pesquisa da API Michelle Pokrass e o diretor de pesquisa Hongyu Ren conduziram uma sessão de perguntas e respostas técnicas on-line no reddit, um dos maiores fóruns abrangentes do mundo.

Os principais tópicos discutidos foram a situação atual da OpenAI, o planejamento de produtos futuros e o fenômeno global do modelo grande DeepSeek-R1.

As melhores perguntas

Um usuário perguntou: "Podemos ver todos os tokens de pensamento do modelo grande?"

Sam Altman: "Sim, em breve estaremos mostrando uma versão mais útil e detalhada. Isso se deve a uma atualização em R1.

Kevin Weil: Estamos trabalhando para mostrar mais do que mostramos hoje - isso acontecerá em breve. A maneira exata de mostrar todo o conteúdo ainda não foi determinada, mas mostrar todas as cadeias de pensamento pode levar a um refinamento competitivo.

Mas também sabemos que as pessoas (pelo menos os usuários avançados) querem ver isso, portanto, encontraremos a maneira certa de equilibrar isso.

Srinivas Narayanan: Estamos procurando maneiras de mostrar mais do processo de pensamento. Fique ligado.

Você consideraria liberar alguns pesos de modelo e publicar algumas pesquisas?

Sam Altman: Sim, estamos discutindo isso. Acho que escolhemos o lado historicamente errado do código fechado e precisamos descobrir uma estratégia diferente de código aberto. Nem todos compartilham dessa opinião, e essa não é a nossa principal prioridade no momento.

Vamos falar sobre o tema quente desta semana, o Deepseek. Obviamente, esse é um modelo impressionante, e sei que ele provavelmente foi treinado com base nos resultados de outros grandes modelos. Como isso afetará seus planos de modelos futuros?

Sam Altman: É um modelo muito bom! Desenvolveremos modelos melhores, mas nossa liderança será menor do que nos anos anteriores.

Suponha que estamos em 2030 e que você acabou de criar um sistema geral de inteligência artificial (AGI). Ele é excelente em todos os parâmetros de referência que você definiu, superando seus melhores engenheiros e pesquisadores em termos de velocidade e desempenho. O que vem a seguir? Algum plano além de "lançá-lo no site"?

Sam Altman: O impacto mais importante, em minha opinião, será acelerar a descoberta científica, porque acredito que esse é o fator que mais contribuirá para melhorar a qualidade de vida.

Srinivas Narayanan: A interface por meio da qual interagimos com a IA mudará fundamentalmente. A IA se tornará mais autônoma, processando continuamente tarefas e metas complexas para nós em segundo plano.

Eles só entrarão em contato conosco quando necessário. A robótica também deve ter avançado o suficiente para ser capaz de realizar tarefas úteis para nós no mundo real. (A julgar por essa resposta, o AI Agent é de fato um dos melhores casos de uso para AGI).

Os recursos avançados de diálogo por voz aparentemente diminuíram desde que o recurso de vídeo foi lançado. Há algum plano para corrigir ou melhorar isso?

Srinivas Narayanan: Obrigado pelo feedback, vou dar uma olhada nisso.

Por que o prazo de conhecimento para a o3 - mini ainda em outubro de 2023? Esse também é o caso do o3 ou do o3 Pro? Há algum plano para atualizar o prazo de conhecimento?

Antes de eu pagar por uma assinatura Plus, o prazo de conhecimento para o GPT - 4o era junho de 2024, mas agora que paguei, o prazo de conhecimento voltou para outubro de 2023. Por que isso acontece?

Sam Altman: Agora que habilitamos a busca, isso (a data de validade do conhecimento) é menos importante. Pessoalmente, nunca mais pensarei na data de validade do conhecimento

Que outros agentes de IA podemos esperar?

Crie um agente para usuários gratuitos também, para acelerar a implementação.

Alguma notícia sobre uma nova versão de DALL-E?

E, finalmente, a pergunta que todos fazem... quando a AGI será alcançada?

Kevin Weil: Mais agentes serão lançados, em breve, e acho que você ficará feliz com eles. A geração de imagens com base no 4o está a alguns meses de distância, e mal posso esperar para mostrá-la a vocês. É realmente ótimo.

A AGI acontecerá.

Haverá grandes melhorias no GPT-4o? Gosto muito do GPT personalizado, e seria ótimo se ele pudesse ser atualizado ou se pudéssemos escolher o modelo a ser usado no GPT personalizado (por exemplo, o3 mini).

Michelle Pokrass: Sim, ainda não terminamos a série 4o!

Haverá uma atualização para o modo de voz avançado? Esse será o foco do GPT-5o?

Sam Altman: Sim, haverá uma atualização para o modo de voz avançado!

Nós o chamaremos de GPT-5, e não GPT-5o. Ainda não há um cronograma.

Qual foi a importância do sucesso do Stargate para o futuro da OpenAI?

Kevin Weil: Muito importante. Tudo o que vimos sugere que quanto mais poder de computação tivermos, melhores serão os modelos que poderemos construir e mais produtos valiosos poderemos criar. Agora estamos ampliando os modelos em duas dimensões ao mesmo tempo - maior pré-treinamento e mais aprendizagem por reforço (RL) / "strawberry" (provavelmente algum tipo de tecnologia ou nome de código de projeto) - e ambos exigem potência de computação.

O mesmo acontece com o fornecimento de produtos a centenas de milhões de usuários! E isso requer poder de computação à medida que avançamos em direção a produtos mais inteligentes que podem trabalhar para os usuários de forma contínua. Portanto, pense na Stargate como nossa fábrica que transforma eletricidade ou GPUs em excelentes produtos.

Publicações semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *