O Google Gêmeos 2.0 família finalmente está completa! Ela domina as paradas assim que é lançada.

Em meio à perseguição e bloqueios de Deepseek, Qwen e o3, o Google lançou três modelos de uma só vez na manhã de hoje: Gemini 2.0 Pro, Gemini 2.0 Flash e Gemini 2.0 Flash-Lite.

No ranking de modelos grandes da LMSYS, o Gemini 2.0-Pro disparou para o topo, e a família Gemini-2.0 avançou para o top 10.

Vamos primeiro olhar para o desempenho do modelo

O Modelos Gemini 2.0 lançados desta vez todos têm seus próprios destaques em termos de desempenho!

Gemini 2.0 Pro (Experimental)

Como o modelo emblemático da série Gemini, a versão Pro representa os recursos de IA mais avançados do Google e se destaca em codificação e inferência em particular:

  • Janela de contexto extragrande: suporta processamento de contexto de até 2 milhões de fichas
  • Integração de ferramentas poderosa: integra profundamente a pesquisa do Google e a execução de código
  • Disponibilidade: já disponível como versão experimental no Google AI Studio, Vertex AI e na plataforma Gemini Advanced

Gêmeos 2.0 Flash

está posicionado como um “cavalo de batalha altamente eficiente”. Ele foi projetado com foco no equilíbrio entre velocidade e desempenho e tem como objetivo fornecer suporte ideal para cenários de aplicativos que exigem respostas de baixa latência:

  • Milhões de janelas de contexto: Suporta contexto de tokens 1M
  • Excelentes capacidades de inferência multimodal: Bom no processamento de dados multimodais, atualmente suporta entrada multimodal e entrada de texto monomodal
  • Expansão futura de recursos: As funções de geração de imagens e conversão de texto em voz estarão disponíveis em breve
  • Disponibilidade: Lançado oficialmente nas plataformas Vertex AI Studio e Google AI Studio, e pode ser acessado via API Gemini.

Gemini 2.0 Flash-Lite (Prévia)

Como o modelo “mais econômico”, o Flash-Lite oferece o melhor equilíbrio entre velocidade, custo e desempenho.

  • Vantagens de custo-benefício: mantendo a mesma velocidade e custo do Flash 1.5, ele supera o Flash 1.5 na maioria dos testes de benchmark.
  • Janela de contexto de nível de milhão: Também suporta 1 milhão de tokens de poder de processamento de contexto.

De acordo com a comparação de avaliação de desempenho divulgada pelo Google, a versão Gemini 2.0 Pro Experimental alcançou as maiores pontuações em quase todos os testes de benchmark, apresentando excelente desempenho:

Ele teve um desempenho particularmente bom em tarefas de geração de código (como LiveCodeBench v5) e problemas matemáticos complexos (como álgebra, geometria e cálculo). Além disso, houve uma melhora significativa no teste de compreensão de documentos longos e complexos.

E o preço

O Google também é um fabricante consciente em termos de custo-benefício de API.

Os milhões de tokens do Gemini 2.0 Flash custam menos de um dólar… Ele suporta múltiplos modos, pesquisas em rede e uma janela de contexto sem precedentes.

Em contraste, o Deepseek V3 atualmente custa um dólar por um milhão de tokens, e a inferência R1 custa quatro dólares.

PS: Mas ainda quero agradecer ao DeepSeek por baixar o preço. Qualquer um que puder baixar o preço é família.

Isso é realmente muito barato! Comparado ao desempenho, acho que o que Gemini foi negligenciado é o preço!

Desempenho do caso

Como ele afirma ser tão bom quanto o Deepseek, definitivamente temos que ver como ele realmente funciona em alguns casos e ver como vários internautas o testaram.

Um jogo de pinball baseado em física

Vamos primeiro analisar este caso popular, que usa um mecanismo de física para simular efeitos realistas, como colisões, atrito e gravidade.

Dica: Escreva um programa Python que exiba uma bola quicando dentro de um hexágono giratório. A bola deve ser afetada pela gravidade e pelo atrito, e deve quicar realisticamente nas paredes giratórias

É assim que o Deepseek R1 e o o3-min funcionam:

A versão gerada pelo Gemini 2.0 Pro Experimental:

Os dois modelos restantes não apresentam bom desempenho

Duplique a dificuldade! Faça a bola se dividir em 100 bolas!

Dica: Escreva um script para 100 bolas amarelas brilhantes quicando dentro de uma esfera, certificando-se de lidar com a detecção de colisão corretamente. Faça a esfera girar lentamente. Certifique-se de que as bolas fiquem dentro da esfera. Implemente em p5.js

Bem feito! A rotação lenta da esfera é muito suave, e a simulação das leis físicas é excelente. As 100 bolas também estão colidindo firmemente e “fazendo seu trabalho” ~

Escreva um script p5.js para simular 25 partículas quicando em um espaço de vácuo dentro de um recipiente cilíndrico. Use uma cor diferente para cada bola e certifique-se de que elas deixem um rastro para mostrar seu movimento. Adicione uma rotação lenta do recipiente para observar melhor o que está acontecendo na cena. Certifique-se de criar regras de detecção de colisão e física apropriadas para garantir que as partículas permaneçam dentro do recipiente. Adicione um recipiente esférico externo. Adicione um efeito de zoom in e out lento em toda a cena.

Uma questão de teste de morango que não pode ser ignorada

E internautas espertos (astutos) lançaram novamente o clássico teste do morango:

Quantos r's tem em morango

E o Gemini 2.0 Flash Thinking Experimental acertou na resposta:

O chefe do Google, Jeff Dean, testou pessoalmente suas habilidades de programação

Jeff Dean, cientista-chefe do Google DeepMind e do Google Research, também testou as habilidades de programação de uma onda do Gemini 2.0 Pro:

Ele fez o modelo completar o clássico jogo Boggle, e o código gerado na primeira vez completou a busca por todas as palavras válidas no “quadrado de letras” jogo:

Além disso, Jeff Dean disse que o código foi concluído em apenas 18,9 segundos, o que é muito rápido.

O CEO do Google DeepMind está totalmente confiante nesta grande atualização do modelo, dizendo que este lançamento estabelece a base para o Google alcançar o trabalho futuro do agente inteligente:

O CEO do Google, Sundar Pichai, deixou claro anteriormente que 2025 será um período crítico para o Google acelerar o desenvolvimento no campo da IA. Parece que Depois desse lançamento, o caminho do Google está mais claro!

Comparado com as rotas de outros gigantes, a rota de IA do Google foca mais na praticidade e fornece diretamente várias opções de versão, assim como uma caixa de ferramentas de IA, onde você pode escolher como quiser, de acordo com suas necessidades, flexível e conveniente, e capaz de atender a todos os tipos de necessidades.

Publicações semelhantes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *