DeepSeek conseguiu! OpenAI admite erro de código fechado, vantagem de ponta se torna menor

Depois de A OpenAI lançou o modelo o3-miniA empresa é composta por três diretores executivos: o CEO Sam Altman, o diretor de pesquisa Mark Chen e o diretor de produtos Kevin Weil;

O vice-presidente de engenharia Srinivas Narayanan, a diretora de pesquisa da API Michelle Pokrass e o diretor de pesquisa Hongyu Ren conduziram uma sessão de perguntas e respostas técnicas on-line no reddit, um dos maiores fóruns abrangentes do mundo.

Os principais tópicos discutidos foram a situação atual da OpenAI, o planejamento de produtos futuros e o fenômeno global do modelo grande DeepSeek-R1.

As melhores perguntas

Um usuário perguntou: "Podemos ver todos os tokens de pensamento do modelo grande?"

Sam Altman: "Sim, em breve estaremos mostrando uma versão mais útil e detalhada. Isso se deve a uma atualização em R1.

Kevin Weil: Estamos trabalhando para mostrar mais do que mostramos hoje - isso acontecerá em breve. A maneira exata de mostrar todo o conteúdo ainda não foi determinada, mas mostrar todas as cadeias de pensamento pode levar a um refinamento competitivo.

Mas também sabemos que as pessoas (pelo menos os usuários avançados) querem ver isso, portanto, encontraremos a maneira certa de equilibrar isso.

Srinivas Narayanan: Estamos procurando maneiras de mostrar mais do processo de pensamento. Fique ligado.

Você consideraria liberar alguns pesos de modelo e publicar algumas pesquisas?

Sam Altman: Sim, estamos discutindo isso. Acho que escolhemos o lado historicamente errado do código fechado e precisamos descobrir uma estratégia diferente de código aberto. Nem todos compartilham dessa opinião, e essa não é a nossa principal prioridade no momento.

Vamos falar sobre o tema quente desta semana, o Deepseek. Obviamente, esse é um modelo impressionante, e sei que ele provavelmente foi treinado com base nos resultados de outros grandes modelos. Como isso afetará seus planos de modelos futuros?

Sam Altman: É um modelo muito bom! Desenvolveremos modelos melhores, mas nossa liderança será menor do que nos anos anteriores.

Suponha que estamos em 2030 e que você acabou de criar um sistema geral de inteligência artificial (AGI). Ele é excelente em todos os parâmetros de referência que você definiu, superando seus melhores engenheiros e pesquisadores em termos de velocidade e desempenho. O que vem a seguir? Algum plano além de "lançá-lo no site"?

Sam Altman: O impacto mais importante, em minha opinião, será acelerar a descoberta científica, porque acredito que esse é o fator que mais contribuirá para melhorar a qualidade de vida.

Srinivas Narayanan: A interface por meio da qual interagimos com a IA mudará fundamentalmente. A IA se tornará mais autônoma, processando continuamente tarefas e metas complexas para nós em segundo plano.

Eles só entrarão em contato conosco quando necessário. A robótica também deve ter avançado o suficiente para ser capaz de realizar tarefas úteis para nós no mundo real. (A julgar por essa resposta, o AI Agent é de fato um dos melhores casos de uso para AGI).

Os recursos avançados de diálogo por voz aparentemente diminuíram desde que o recurso de vídeo foi lançado. Há algum plano para corrigir ou melhorar isso?

Srinivas Narayanan: Obrigado pelo feedback, vou dar uma olhada nisso.

Por que o prazo de conhecimento para a o3 - mini ainda em outubro de 2023? Esse também é o caso do o3 ou do o3 Pro? Há algum plano para atualizar o prazo de conhecimento?

Antes de eu pagar por uma assinatura Plus, o prazo de conhecimento para o GPT - 4o era junho de 2024, mas agora que paguei, o prazo de conhecimento voltou para outubro de 2023. Por que isso acontece?

Sam Altman: Agora que habilitamos a busca, isso (a data de validade do conhecimento) é menos importante. Pessoalmente, nunca mais pensarei na data de validade do conhecimento

Que outros agentes de IA podemos esperar?

Crie um agente para usuários gratuitos também, para acelerar a implementação.

Alguma notícia sobre uma nova versão de DALL-E?

E, finalmente, a pergunta que todos fazem... quando a AGI será alcançada?

Kevin Weil: Mais agentes serão lançados, em breve, e acho que você ficará feliz com eles. A geração de imagens com base no 4o está a alguns meses de distância, e mal posso esperar para mostrá-la a vocês. É realmente ótimo.

A AGI acontecerá.

Haverá grandes melhorias no GPT-4o? Gosto muito do GPT personalizado, e seria ótimo se ele pudesse ser atualizado ou se pudéssemos escolher o modelo a ser usado no GPT personalizado (por exemplo, o3 mini).

Michelle Pokrass: Sim, ainda não terminamos a série 4o!

Haverá uma atualização para o modo de voz avançado? Esse será o foco do GPT-5o?

Sam Altman: Sim, haverá uma atualização para o modo de voz avançado!

Nós o chamaremos de GPT-5, e não GPT-5o. Ainda não há um cronograma.

Qual foi a importância do sucesso do Stargate para o futuro da OpenAI?

Kevin Weil: Muito importante. Tudo o que vimos sugere que quanto mais poder de computação tivermos, melhores serão os modelos que poderemos construir e mais produtos valiosos poderemos criar. Agora estamos ampliando os modelos em duas dimensões ao mesmo tempo - maior pré-treinamento e mais aprendizagem por reforço (RL) / "strawberry" (provavelmente algum tipo de tecnologia ou nome de código de projeto) - e ambos exigem potência de computação.

O mesmo acontece com o fornecimento de produtos a centenas de milhões de usuários! E isso requer poder de computação à medida que avançamos em direção a produtos mais inteligentes que podem trabalhar para os usuários de forma contínua. Portanto, pense na Stargate como nossa fábrica que transforma eletricidade ou GPUs em excelentes produtos.

DeepSeek conseguiu! A OpenAI admite o erro de código fechado, e a vantagem de liderança se torna menor

As melhores perguntas

Altman: Estávamos errados sobre a IA de código aberto! O DeepSeek tornou o OpenAI menos vantajoso, e o próximo é o GPT-5

O segredo por trás do DeepSeek 1 | DeepSeekMath e detalhes do GRPO

Notícias de última hora! A OpenAI lançou hoje dois novos modelos de inferência: o3-mini e o3-mini-high.

Le Chat lidera as paradas, com um investimento de cem bilhões de dólares. Depois dos EUA e da China, é a terceira potência de IA?

O que o Deepseek pode alcançar? Nem mesmo o OpenAI consegue?

OpenAI o3-mini vs. DeepSeek-R1: quem é o rei da nova geração de modelos de IA?

Deixe um comentário Cancelar resposta

As melhores perguntas

Publicações semelhantes

Deixe um comentário Cancelar resposta