o3-mini e o3-mini (high) serão lançados hoje.

Os usuários regulares também receberão o3-minie os usuários plus poderão usar o o3-mini (high).

O o3-mini (high) é cerca de 200 pontos mais alto que o o1 no Codeforce, mais rápido que o o1 e tem melhor desempenho em codificação e matemática, mas o custo ainda está no nível do o1-mini.

Os usuários Plus podem usar a o3-mini 100 vezes por dia. No entanto, o limite de uso do o3-mini (alto) precisa ser confirmado.

Alguns internautas disseram que, sim, o R1 é tão popular que a Openai não pode se conter:

E antes, a equipe do Alibaba Qwen lançou o qwen2.5-max na véspera do Ano Novo. Durante o Festival da Primavera, todo mundo ainda precisa rolar, hahaha...

Na verdade, já na transmissão ao vivo do Natal, A Openai anunciou que o o3 mini estará disponível no início de 2025:

Ainda precisamos falar sobre o que são o3 e o3-mini?

o3: Um modelo de inferência de ponta que se destaca em codificação, matemática e até mesmo em testes de benchmark orientados para AGI. Ele define um novo padrão de referência para inteligência e solução de problemas.

o3-mini: Uma versão econômica do o3 que oferece desempenho superior a um custo e velocidade muito baixos.

Esses modelos levaram a inferência a um nível totalmente novo, possibilitando avanços em tarefas complexas que exigem compreensão e lógica aprofundadas.

O o3 traz três grandes avanços.

Capacidade de programação: precisão de 71,7% na programação prática, 20% superior a o1. 2727 pontos no Codeforces, já ultrapassando o nível humano.

Nível matemático: precisão de quase 97% na rodada de qualificação da Olimpíada de Matemática dos EUA. Até mesmo os problemas matemáticos mais difíceis da fronteira da Epic AI podem obter resultados de 25%.

O mais surpreendente é o teste Arc AGI: 87,5%, superando os humanos pela primeira vez nesse teste de benchmark extremamente difícil.

Por que o o3-mini é uma inovação revolucionária? O o3-mini traz duas mudanças.

Pensamento adaptativo: a profundidade do raciocínio pode ser ajustada de acordo com a dificuldade da tarefa, com três modos para escolher: baixo, médio e alto.

Isso torna a IA mais alinhada com os cenários de uso no mundo real.

Inovador em termos de custo-benefício: custo mais baixo do que o o1-mini, resposta mais rápida e melhores resultados.

No entanto, os internautas lamentam o fato de a o3 high consumir $1.000 por tarefa:

Além disso, há de fato muitos modelos disponíveis, e ainda não confirmamos como alternar entre eles.

Publicações semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *