Notícias de última hora! A OpenAI lançou dois novos modelos de inferência hoje: o3-mini e o3-mini-high.

o3-mini e o3-mini (high) serão lançados hoje.

Os usuários regulares também receberão o3-minie os usuários plus poderão usar o o3-mini (high).

O o3-mini (high) é cerca de 200 pontos mais alto que o o1 no Codeforce, mais rápido que o o1 e tem melhor desempenho em codificação e matemática, mas o custo ainda está no nível do o1-mini.

Os usuários Plus podem usar a o3-mini 100 vezes por dia. No entanto, o limite de uso do o3-mini (alto) precisa ser confirmado.

Alguns internautas disseram que, sim, o R1 é tão popular que a Openai não pode se conter:

E antes, a equipe do Alibaba Qwen lançou o qwen2.5-max na véspera do Ano Novo. Durante o Festival da Primavera, todo mundo ainda precisa rolar, hahaha...

Na verdade, já na transmissão ao vivo do Natal, A Openai anunciou que o o3 mini estará disponível no início de 2025:

Índice

Ainda precisamos falar sobre o que são o3 e o3-mini?

o3: Um modelo de inferência de ponta que se destaca em codificação, matemática e até mesmo em testes de benchmark orientados para AGI. Ele define um novo padrão de referência para inteligência e solução de problemas.

o3-mini: Uma versão econômica do o3 que oferece desempenho superior a um custo e velocidade muito baixos.

Esses modelos levaram a inferência a um nível totalmente novo, possibilitando avanços em tarefas complexas que exigem compreensão e lógica aprofundadas.

O o3 traz três grandes avanços.

Capacidade de programação: precisão de 71,7% na programação prática, 20% superior a o1. 2727 pontos no Codeforces, já ultrapassando o nível humano.

Nível matemático: precisão de quase 97% na rodada de qualificação da Olimpíada de Matemática dos EUA. Até mesmo os problemas matemáticos mais difíceis da fronteira da Epic AI podem obter resultados de 25%.

O mais surpreendente é o teste Arc AGI: 87,5%, superando os humanos pela primeira vez nesse teste de benchmark extremamente difícil.

Por que o o3-mini é uma inovação revolucionária? O o3-mini traz duas mudanças.

Pensamento adaptativo: a profundidade do raciocínio pode ser ajustada de acordo com a dificuldade da tarefa, com três modos para escolher: baixo, médio e alto.

Isso torna a IA mais alinhada com os cenários de uso no mundo real.

Inovador em termos de custo-benefício: custo mais baixo do que o o1-mini, resposta mais rápida e melhores resultados.

No entanto, os internautas lamentam o fato de a o3 high consumir $1.000 por tarefa:

Além disso, há de fato muitos modelos disponíveis, e ainda não confirmamos como alternar entre eles.

Sem categoria

Atualização DeepSeek-R1-0528: Pensamento mais profundo, raciocínio mais forte

Porzddeepseeker 29 de maio de 202529 de maio de 2025

O modelo DeepSeek R1 passou por uma pequena atualização de versão, sendo a versão atual DeepSeek-R1-0528. Ao acessar a página ou o aplicativo do DeepSeek, ative o recurso "Pensamento Profundo" na interface de diálogo para experimentar a versão mais recente. Os pesos do modelo DeepSeek-R1-0528 foram enviados para o HuggingFace. Nos últimos quatro meses, o DeepSeek-R1 passou por...

Sem categoria

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

Porzddeepseeker fevereiro 1, 2025fevereiro 1, 2025

A OpenAI lançou seu mais recente modelo de inferência, o o3-mini, que é otimizado para áreas como ciências, matemática e programação, oferecendo resposta mais rápida, maior precisão e menor custo. Em comparação com seu antecessor o1-mini, o o3-mini melhorou significativamente seus recursos de inferência, especialmente na solução de problemas complexos. Os testadores preferem as respostas do o3-mini por 56%, e a taxa de erro foi...

Sem categoria

O Google lançou três novos modelos de uma vez: o Gemini-2.0-Pro é gratuito, tem uma pontuação excelente e está em primeiro lugar, além de ser adequado para codificação e processamento de prompts complexos!

Porzddeepseeker 8 de fevereiro de 20258 de fevereiro de 2025

A história do Gemini 2.0 está acelerando. A versão Flash Thinking Experimental em dezembro trouxe aos desenvolvedores um modelo funcional com baixa latência e alto desempenho. No início deste ano, o 2.0 Flash Thinking Experimental foi atualizado no Google AI Studio para melhorar ainda mais o desempenho ao combinar a velocidade do Flash com recursos de inferência aprimorados. Na semana passada,…

Sem categoria

O DeepSeek R1 ficou em primeiro lugar no teste de redação criativa, e o o3 mini foi ainda pior do que o o1 mini!

Porzddeepseeker fevereiro 3, 2025fevereiro 3, 2025

O DeepSeek R1 ganhou o campeonato no teste de benchmark de escrita de contos criativos, superando com sucesso o jogador dominante anterior, o Claude 3.5 Sonnet! Teste de benchmark O teste de benchmark criado pelo pesquisador Lech Mazur não é uma competição de redação comum. Cada modelo de IA teve que completar 500 contos, e cada conto teve que incorporar de forma inteligente...

Sem categoria

DeepSeek lançou seu código fonte, explicação detalhada do FlashMLA

Porzddeepseeker 24 de fevereiro de 202524 de fevereiro de 2025

Na semana passada, o DeepSeek anunciou que disponibilizaria cinco projetos de código aberto na próxima semana: Os internautas disseram: "Desta vez, o OpenAI realmente está aqui". Agora mesmo, o primeiro projeto de código aberto chegou, relacionado à aceleração de inferência, FlashMLA: Endereço do projeto de código aberto: DeepSeek FlashMLA Ele está com código aberto há duas horas, e o Github já tem mais de 2,7 mil estrelas: O…

Sem categoria

Qwen2.5-max vs DeepSeek R1: Uma comparação profunda de modelos: uma análise completa de cenários de aplicação

Porzddeepseeker 14 de fevereiro de 202514 de fevereiro de 2025

Introdução Hoje, os modelos de linguagem grande (LLMs) desempenham um papel crucial. No início de 2025, conforme a competição por IA se intensificou, a Alibaba lançou o novo modelo de IA Qwen2.5-max, e a DeepSeek, uma empresa de Hangzhou, China, lançou o modelo R1, que representa o auge da tecnologia LLM. O Deepseek R1 é um modelo de IA de código aberto que atraiu…

Notícias de última hora! A OpenAI lançou hoje dois novos modelos de inferência: o3-mini e o3-mini-high.

Ainda precisamos falar sobre o que são o3 e o3-mini?

O o3 traz três grandes avanços.

Por que o o3-mini é uma inovação revolucionária? O o3-mini traz duas mudanças.

Atualização DeepSeek-R1-0528: Pensamento mais profundo, raciocínio mais forte

Uma comparação abrangente do recém-lançado o3-mini e do DeepSeek R1 da OpenAI

O Google lançou três novos modelos de uma vez: o Gemini-2.0-Pro é gratuito, tem uma pontuação excelente e está em primeiro lugar, além de ser adequado para codificação e processamento de prompts complexos!

O DeepSeek R1 ficou em primeiro lugar no teste de redação criativa, e o o3 mini foi ainda pior do que o o1 mini!

DeepSeek lançou seu código fonte, explicação detalhada do FlashMLA

Qwen2.5-max vs DeepSeek R1: Uma comparação profunda de modelos: uma análise completa de cenários de aplicação

Deixe um comentário Cancelar resposta

Ainda precisamos falar sobre o que são o3 e o3-mini?

O o3 traz três grandes avanços.

Por que o o3-mini é uma inovação revolucionária? O o3-mini traz duas mudanças.

Publicações semelhantes

Deixe um comentário Cancelar resposta