O o3-mini está aqui, com o ímpeto de um desafiante

Em 31 de janeiro, a OpenAI lançou o novíssimo modelo o3-mini large e forneceu algumas de suas funções gratuitamente a todos os usuários do ChatGPT. Embora haja um limite no número de consultas, isso permite que os usuários experimentem o mais recente modelo comercial da OpenAI o mais rápido possível.

Há apenas alguns dias, a DeepSeek, uma grande empresa de modelos da China, lançou seu mais recente modelo de código aberto, o DeepSeek-R1, que também estabeleceu sua própria influência na comunidade de IA.

O modelo DeepSeek-R1 tem a capacidade de se equiparar ao modelo o1 da openai, mas é mais barato. Mais importante ainda, o DeepSeek R1 é um modelo de código aberto, que é a maior diferença em relação ao openai.

A pergunta é: é o3-mini realmente melhor do que DeepSeek-R1?

Na comparação oficial de dados fornecida pela OpenAI, apenas alguns dos modelos lançados pela OpenAI são comparados, e os resultados não são diretamente comparados com os dos grandes modelos de software. Modelo DeepSeek R1. No entanto, alguns dados de testes de benchmark recém-lançados mostram que o o3-mini é um pouco melhor em muitos aspectos. Podemos entender essa situação observando as pontuações de diferentes testes.

Vamos deixar os dados falarem por si mesmos e analisar em profundidade a verdadeira força desses dois modelos de IA. Às vezes, os dados são uma coisa, mas, na maioria das vezes, também dependem da experiência real e do uso do usuário.

Comparação de dados: o o3-mini é mais inteligente, mas o DeepSeek-R1 é mais "matemático"

Pontuação média geral

OpenAI o3-mini: 73,94

DeepSeek-R1: 71,38

Está claro que a pontuação geral do o3-mini é um pouco maior, o que indica que ele tem um desempenho mais estável em tarefas abrangentes. Ele pode concluir tarefas de forma mais estável, mas não tem uma grande diferença em relação ao modelo de código aberto do DeepSeek.

Capacidade de raciocínio (a capacidade da IA de entender, analisar e raciocinar sobre as informações)

OpenAI o3-mini: 89,58

DeepSeek-R1: 83,17

Em tarefas de raciocínio, o o3-mini claramente vence, o que significa que ele é melhor em extrair o conteúdo principal de informações complexas e fazer inferências lógicas.

Capacidade de programação (capacidade da IA de processar códigos)

OpenAI o3-mini: 82,74

DeepSeek-R1: 66,74

Se você for um desenvolvedor, o o3-mini pode ser uma escolha melhor. As pontuações mostram uma grande diferença, com a capacidade de codificação do o3-mini significativamente à frente do DeepSeek-R1, além de ser capaz de entender e resolver melhor os problemas de programação. Essa também é uma área em que o o3-mini tem uma vantagem relativamente grande

Habilidade matemática (cálculo, derivação de fórmulas, raciocínio matemático)

OpenAI o3-mini: 65,65

DeepSeek-R1: 79,54

O DeepSeek-R1 é mais forte em tarefas matemáticas, indicando que ele é melhor em cálculos numéricos e raciocínio matemático.

Habilidades de análise de dados (capacidade de processar e entender dados)

OpenAI o3-mini: 70,64

DeepSeek-R1: 69,78

O o3-mini tem uma ligeira vantagem nas tarefas de análise de dados.

Habilidades de compreensão do idioma

OpenAI o3-mini: 50,68

DeepSeek-R1: 48,53

Embora a vantagem não seja grande, o o3-mini ainda tem um desempenho ligeiramente superior em tarefas de linguagem.

Conexões do NYT (quebra-cabeça)

o3-mini: 72,4 pontos (excelente desempenho)

DeepSeek-R1: 54,4 pontos

Exame final humano (tarefa complexa)

o3-mini: precisão 13.0%

DeepSeek-R1: precisão de 9,4%

Codeforces (teste de aptidão para programação)

o3-mini > DeepSeek-R1 AIME 2024 (compreensão de instruções complexas)

o3-mini > DeepSeek-R1 Em resumo, o o3-mini é mais forte em raciocínio, programação e idiomas, enquanto o DeepSeek-R1 é mais vantajoso em habilidades matemáticas.

Comparação de preços de API: quem é mais econômico?

O DeepSeek-R1 é mais barato em termos de preços de API, enquanto o o3-mini ainda é relativamente caro:

O DeepSeek-R1 é mais barato e, portanto, adequado para desenvolvedores com orçamento limitado.

Código aberto vs. código fechado: A OpenAI ainda é fechada

Se você estiver preocupado com o código aberto, o DeepSeek-R1 é uma opção melhor. Ele é totalmente de código aberto, enquanto o o3-mini ainda segue a tradição do OpenAI e permanece fechado. Isso pode afetar a liberdade dos desenvolvedores em termos de otimização e personalização do modelo.

Conclusão final: quem é mais digno de ser escolhido?

Dimensãoo3-mini (OpenAI)DeepSeek-R1
Pontuação geral73.9471.38
Inferências89,58 (mais forte)83.17
Programação82,74 (mais forte)66.74
Matemática65.6579.54
Análise de dados70.6469.78
Compreensão do idioma50.6848.53
Preço da APIMais caromais barato
Código abertopróximoCódigo-fonte totalmente aberto

A quem se destina?

  • Se você é um desenvolvedor ou engenheiro e necessidade Recursos avançados de programação e inferênciao o3-mini é a melhor opção. Acreditamos que o open e o O3mini têm um desempenho muito bom nessa área de identificação e inferência. Ao mesmo tempo, os recursos mais avançados de programação e inferência também podem ajudá-lo a escrever códigos e programas melhores, reduzindo o tempo de modificação e inspeção
  • Se você é um pesquisador matemático ou sensíveis aos custos de API, o DeepSeek-R1 é uma opção mais econômica. Esse modelo tem melhor suporte e assistência para pesquisadores matemáticos e tem um custo de uso mais adequado
  • Se você precisar de um modelo de código abertoo DeepSeek-R1 é o vencedor. Obviamente, o meta, que se concentra no código-fonte aberto, não é comparável ao DeepSeek em alguns recursos. No entanto, o modelo grande de openAI comparável é mais caro e é um modelo comercial de código fechado. O DeepSeek liderará a pesquisa e o desenvolvimento de IA e, ao mesmo tempo, permitirá que mais empresas e usuários individuais implantem modelos grandes de IA localmente ou em servidores de nuvem, protegendo a segurança e a privacidade de seus dados

Perspectiva futura: a concorrência por modelos de IA está se intensificando

Tanto o OpenAI quanto o DeepSeek estão impulsionando o desenvolvimento da tecnologia de IA. Embora o o3-mini seja atualmente um pouco melhor na maioria das tarefas, o DeepSeek-R1 ainda tem suas próprias vantagens exclusivas.

A natureza de código aberto do DeepSeek atraiu a atenção de muitos desenvolvedores e usuários. O preço mais baixo também estabelece uma boa base para o desenvolvimento de aplicativos de IA.

Por outro lado, a OpenAI, como líder no setor de IA, tem muita inovação e desenvolvimento, mas o modelo comercial não aberto e o alto custo de uso aumentaram o limite de uso, o que não favorece a promoção da IA.

Acreditamos que o deepseek fez um ótimo trabalho para o setor de IA. O código aberto dará aos desenvolvedores mais chances de saber mais sobre o modelo avançado de IA.

No futuro, poderemos ver o surgimento de modelos ainda mais avançados, como o GPT-5 ou o DeepSeek-R2 da OpenAI. Para usuários comuns, a melhor IA não é a IA "mais forte", mas a IA que melhor atende às suas necessidades. Ao escolher um modelo de IA adequado para você, é preciso considerar seus próprios cenários de aplicativos e orçamento.

Publicações semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *