
o3-mini e o3-mini (high) serão lançados hoje.

Os usuários regulares também receberão o3-minie os usuários plus poderão usar o o3-mini (high).
O o3-mini (high) é cerca de 200 pontos mais alto que o o1 no Codeforce, mais rápido que o o1 e tem melhor desempenho em codificação e matemática, mas o custo ainda está no nível do o1-mini.

Os usuários Plus podem usar a o3-mini 100 vezes por dia. No entanto, o limite de uso do o3-mini (alto) precisa ser confirmado.
Alguns internautas disseram que, sim, o R1 é tão popular que a Openai não pode se conter:


E antes, a equipe do Alibaba Qwen lançou o qwen2.5-max na véspera do Ano Novo. Durante o Festival da Primavera, todo mundo ainda precisa rolar, hahaha...
Na verdade, já na transmissão ao vivo do Natal, A Openai anunciou que o o3 mini estará disponível no início de 2025:


Ainda precisamos falar sobre o que são o3 e o3-mini?
o3: Um modelo de inferência de ponta que se destaca em codificação, matemática e até mesmo em testes de benchmark orientados para AGI. Ele define um novo padrão de referência para inteligência e solução de problemas.
o3-mini: Uma versão econômica do o3 que oferece desempenho superior a um custo e velocidade muito baixos.
Esses modelos levaram a inferência a um nível totalmente novo, possibilitando avanços em tarefas complexas que exigem compreensão e lógica aprofundadas.
O o3 traz três grandes avanços.
Capacidade de programação: precisão de 71,7% na programação prática, 20% superior a o1. 2727 pontos no Codeforces, já ultrapassando o nível humano.
Nível matemático: precisão de quase 97% na rodada de qualificação da Olimpíada de Matemática dos EUA. Até mesmo os problemas matemáticos mais difíceis da fronteira da Epic AI podem obter resultados de 25%.
O mais surpreendente é o teste Arc AGI: 87,5%, superando os humanos pela primeira vez nesse teste de benchmark extremamente difícil.

Por que o o3-mini é uma inovação revolucionária? O o3-mini traz duas mudanças.
Pensamento adaptativo: a profundidade do raciocínio pode ser ajustada de acordo com a dificuldade da tarefa, com três modos para escolher: baixo, médio e alto.
Isso torna a IA mais alinhada com os cenários de uso no mundo real.
Inovador em termos de custo-benefício: custo mais baixo do que o o1-mini, resposta mais rápida e melhores resultados.
No entanto, os internautas lamentam o fato de a o3 high consumir $1.000 por tarefa:

Além disso, há de fato muitos modelos disponíveis, e ainda não confirmamos como alternar entre eles.
