DeepSeek conseguiu! OpenAI admite erro de código fechado, vantagem de ponta se torna menor

Depois de A OpenAI lançou o modelo o3-miniA empresa é composta por três diretores executivos: o CEO Sam Altman, o diretor de pesquisa Mark Chen e o diretor de produtos Kevin Weil;

O vice-presidente de engenharia Srinivas Narayanan, a diretora de pesquisa da API Michelle Pokrass e o diretor de pesquisa Hongyu Ren conduziram uma sessão de perguntas e respostas técnicas on-line no reddit, um dos maiores fóruns abrangentes do mundo.

Os principais tópicos discutidos foram a situação atual da OpenAI, o planejamento de produtos futuros e o fenômeno global do modelo grande DeepSeek-R1.

As melhores perguntas

Um usuário perguntou: "Podemos ver todos os tokens de pensamento do modelo grande?"

Sam Altman: "Sim, em breve estaremos mostrando uma versão mais útil e detalhada. Isso se deve a uma atualização em R1.

Kevin Weil: Estamos trabalhando para mostrar mais do que mostramos hoje - isso acontecerá em breve. A maneira exata de mostrar todo o conteúdo ainda não foi determinada, mas mostrar todas as cadeias de pensamento pode levar a um refinamento competitivo.

Mas também sabemos que as pessoas (pelo menos os usuários avançados) querem ver isso, portanto, encontraremos a maneira certa de equilibrar isso.

Srinivas Narayanan: Estamos procurando maneiras de mostrar mais do processo de pensamento. Fique ligado.

Você consideraria liberar alguns pesos de modelo e publicar algumas pesquisas?

Sam Altman: Sim, estamos discutindo isso. Acho que escolhemos o lado historicamente errado do código fechado e precisamos descobrir uma estratégia diferente de código aberto. Nem todos compartilham dessa opinião, e essa não é a nossa principal prioridade no momento.

Vamos falar sobre o tema quente desta semana, o Deepseek. Obviamente, esse é um modelo impressionante, e sei que ele provavelmente foi treinado com base nos resultados de outros grandes modelos. Como isso afetará seus planos de modelos futuros?

Sam Altman: É um modelo muito bom! Desenvolveremos modelos melhores, mas nossa liderança será menor do que nos anos anteriores.

Suponha que estamos em 2030 e que você acabou de criar um sistema geral de inteligência artificial (AGI). Ele é excelente em todos os parâmetros de referência que você definiu, superando seus melhores engenheiros e pesquisadores em termos de velocidade e desempenho. O que vem a seguir? Algum plano além de "lançá-lo no site"?

Sam Altman: O impacto mais importante, em minha opinião, será acelerar a descoberta científica, porque acredito que esse é o fator que mais contribuirá para melhorar a qualidade de vida.

Srinivas Narayanan: A interface por meio da qual interagimos com a IA mudará fundamentalmente. A IA se tornará mais autônoma, processando continuamente tarefas e metas complexas para nós em segundo plano.

Eles só entrarão em contato conosco quando necessário. A robótica também deve ter avançado o suficiente para ser capaz de realizar tarefas úteis para nós no mundo real. (A julgar por essa resposta, o AI Agent é de fato um dos melhores casos de uso para AGI).

Os recursos avançados de diálogo por voz aparentemente diminuíram desde que o recurso de vídeo foi lançado. Há algum plano para corrigir ou melhorar isso?

Srinivas Narayanan: Obrigado pelo feedback, vou dar uma olhada nisso.

Por que o prazo de conhecimento para a o3 - mini ainda em outubro de 2023? Esse também é o caso do o3 ou do o3 Pro? Há algum plano para atualizar o prazo de conhecimento?

Antes de eu pagar por uma assinatura Plus, o prazo de conhecimento para o GPT - 4o era junho de 2024, mas agora que paguei, o prazo de conhecimento voltou para outubro de 2023. Por que isso acontece?

Sam Altman: Agora que habilitamos a busca, isso (a data de validade do conhecimento) é menos importante. Pessoalmente, nunca mais pensarei na data de validade do conhecimento

Que outros agentes de IA podemos esperar?

Crie um agente para usuários gratuitos também, para acelerar a implementação.

Alguma notícia sobre uma nova versão de DALL-E?

E, finalmente, a pergunta que todos fazem... quando a AGI será alcançada?

Kevin Weil: Mais agentes serão lançados, em breve, e acho que você ficará feliz com eles. A geração de imagens com base no 4o está a alguns meses de distância, e mal posso esperar para mostrá-la a vocês. É realmente ótimo.

A AGI acontecerá.

Haverá grandes melhorias no GPT-4o? Gosto muito do GPT personalizado, e seria ótimo se ele pudesse ser atualizado ou se pudéssemos escolher o modelo a ser usado no GPT personalizado (por exemplo, o3 mini).

Michelle Pokrass: Sim, ainda não terminamos a série 4o!

Haverá uma atualização para o modo de voz avançado? Esse será o foco do GPT-5o?

Sam Altman: Sim, haverá uma atualização para o modo de voz avançado!

Nós o chamaremos de GPT-5, e não GPT-5o. Ainda não há um cronograma.

Qual foi a importância do sucesso do Stargate para o futuro da OpenAI?

Kevin Weil: Muito importante. Tudo o que vimos sugere que quanto mais poder de computação tivermos, melhores serão os modelos que poderemos construir e mais produtos valiosos poderemos criar. Agora estamos ampliando os modelos em duas dimensões ao mesmo tempo - maior pré-treinamento e mais aprendizagem por reforço (RL) / "strawberry" (provavelmente algum tipo de tecnologia ou nome de código de projeto) - e ambos exigem potência de computação.

O mesmo acontece com o fornecimento de produtos a centenas de milhões de usuários! E isso requer poder de computação à medida que avançamos em direção a produtos mais inteligentes que podem trabalhar para os usuários de forma contínua. Portanto, pense na Stargate como nossa fábrica que transforma eletricidade ou GPUs em excelentes produtos.

Publicações semelhantes

Sem categoria

No círculo da IA, o DeepSeek R1 tem superado constantemente o o1 e o Claude em testes físicos, e entramos na era de ouro da RL.

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

Nenhum de nós esperava que seria assim que 2025 começaria no campo da IA. O DeepSeek R1 é realmente incrível! Recentemente, o "misterioso poder oriental" DeepSeek vem "controlando duramente" o Vale do Silício. Pedi ao R1 que explicasse o teorema de Pitágoras em detalhes. Tudo isso foi feito pela IA em menos de 30 segundos, sem qualquer...

Sem categoria

O que o Deepseek pode alcançar? Nem mesmo o OpenAI consegue?

Porzddeepseeker 10 de fevereiro de 202510 de fevereiro de 2025

O verdadeiro valor do DeepSeek é subestimado! O DeepSeek-R1 sem dúvida trouxe uma nova onda de entusiasmo ao mercado. Não apenas os chamados alvos beneficiários relevantes estão aumentando acentuadamente, mas algumas pessoas até desenvolveram cursos e softwares relacionados ao DeepSeek na tentativa de ganhar dinheiro com isso. Acreditamos que, embora esses fenômenos tenham um…

Sem categoria

Le Chat lidera as paradas, com um investimento de cem bilhões de dólares. Depois dos EUA e da China, é a terceira potência de IA?

Porzddeepseeker 11 de fevereiro de 202511 de fevereiro de 2025

Em 9 de fevereiro, o presidente francês Emmanuel Macron anunciou que a França investiria 109 bilhões de euros (113 bilhões de dólares americanos) no campo da IA nos próximos anos. Esse investimento será usado para construir um parque de IA na França, melhorar a infraestrutura e investir em startups locais de IA. Enquanto isso, a Mistral, uma startup francesa,…

Sem categoria

Atualização DeepSeek-R1-0528: Pensamento mais profundo, raciocínio mais forte

Porzddeepseeker 29 de maio de 202529 de maio de 2025

O modelo DeepSeek R1 passou por uma pequena atualização de versão, sendo a versão atual DeepSeek-R1-0528. Ao acessar a página ou o aplicativo do DeepSeek, ative o recurso "Pensamento Profundo" na interface de diálogo para experimentar a versão mais recente. Os pesos do modelo DeepSeek-R1-0528 foram enviados para o HuggingFace. Nos últimos quatro meses, o DeepSeek-R1 passou por...

Sem categoria

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

A OpenAI lançou seu mais recente modelo de inferência, o o3-mini, que é otimizado para áreas como ciências, matemática e programação, oferecendo resposta mais rápida, maior precisão e menor custo. Em comparação com seu antecessor o1-mini, o o3-mini melhorou significativamente seus recursos de inferência, especialmente na solução de problemas complexos. Os testadores preferem as respostas do o3-mini por 56%, e a taxa de erro foi...

Sem categoria

O Confronto dos Quatro Melhores Modelos! Uma Análise Mostra o Poder do Deepseek R1

Porzddeepseeker 1 de junho de 20251 de junho de 2025

Nos últimos dias, o Deepseek-R1 0528 foi oficialmente disponibilizado como código aberto. No LiveCodeBench, seu desempenho está quase no mesmo nível do o3 (alto) da OpenAI; no teste de benchmark multilíngue da Aider, ele se compara ao Claude Opus. Quando foi lançado no site oficial, testamos rapidamente seus recursos de front-end e os consideramos excepcionalmente…

DeepSeek conseguiu! A OpenAI admite o erro de código fechado, e a vantagem de liderança se torna menor

As melhores perguntas

No círculo da IA, o DeepSeek R1 tem superado constantemente o o1 e o Claude em testes físicos, e entramos na era de ouro da RL.

O que o Deepseek pode alcançar? Nem mesmo o OpenAI consegue?

Le Chat lidera as paradas, com um investimento de cem bilhões de dólares. Depois dos EUA e da China, é a terceira potência de IA?

Atualização DeepSeek-R1-0528: Pensamento mais profundo, raciocínio mais forte

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

O Confronto dos Quatro Melhores Modelos! Uma Análise Mostra o Poder do Deepseek R1

Deixe um comentário Cancelar resposta