Google afirma que Gemini 2.5 supera os melhores modelos da OpenAI, DeepSeek e outros gigantes da tecnologia de IA

O Google acaba de lançar o Gemini 2.5, que a empresa chama de seu “modelo de IA mais inteligente até agora”. A primeira versão do modelo foi o Gemini 2.5 Pro, que alcançou pontuações de benchmark impressionantes em muitos testes.

O Google afirma que o Gemini 2.5 supera os melhores modelos da OpenAI, DeepSeek e outros gigantes da tecnologia de IA

O Gemini 2.5 Pro já está disponível no Google AI Studio e no aplicativo Gemini, se você for um usuário Gemini Advanced . O Gemini 2.5 Pro também estará disponível através da Vertex AI em um futuro próximo.

O Google não divulgou os preços do Gemini 2.5 Pro ou de outros modelos Gemini 2.5 neste momento.

Todos os modelos que usam o Gemini 2.5 são "modelos de pensamento", o que significa que eles podem processar o processo de pensamento antes de gerar uma resposta. Esses modelos de “raciocínio” são o próximo grande passo no espaço da IA ​​porque geram respostas mais complexas e, muitas vezes, mais precisas.

“Agora, com o Gemini 2.5, alcançamos um novo nível de desempenho ao combinar um modelo base significativamente melhorado com um pós-treinamento aprimorado ”, disse o Google.

“No futuro, incorporaremos essas capacidades de pensamento diretamente em todos os nossos modelos para que eles possam lidar com problemas mais complexos e dar suporte aos agentes com uma consciência de contexto ainda melhor . ”

Como o Gemini 2.5 se compara aos modelos OpenAI?

Google afirma que Gemini 2.5 supera os melhores modelos da OpenAI, DeepSeek e outros gigantes da tecnologia de IA
Referência do Google Gemini 2.5

Os modelos Gemini 2.5 Pro do Google superam os modelos top de linha anteriores da OpenAI e DeepSeek.

As pontuações de benchmark do Gemini 2.5 compartilhadas pelo Google são bastante impressionantes. O Gemini 2.5 Pro Experimental obteve 18,5% no Último Exame da Humanidade.

Essa pontuação significa que, pelo menos por enquanto, o Gemini 2.5 Pro Experimental é o melhor modelo por essa métrica. Sua pontuação supera o OpenAI 03-mini (14%) e o DeepSeek R1 (8,6%).

Esse teste específico é considerado difícil, embora não seja a única maneira de medir o desempenho de um modelo de IA.

O Google também destacou os recursos de programação do Gemini 2.5 Pro e os padrões do modelo em matemática e ciências. O Gemini 2.5 Pro está atualmente liderando em benchmarks de matemática e ciências, medidos pelo GPQA e AIME 2025.

É possível programar no Gemini 2.5?

A programação é o foco principal do Gemini 2.5. O Google afirma que houve "um grande salto em relação à versão 2.0" e diz que mais melhorias estão a caminho.

O novo modelo do Google pode criar aplicativos da web e aplicativos de código de agente. Uma demonstração do Google mostra o Gemini 2.5 Pro sendo usado para criar um jogo a partir de um único prompt de linha.

4 razões pelas quais o Gemini 2.5 Pro do Google é importante para a IA empresarial

Aqui estão quatro pontos-chave que as equipes empresariais devem ter em mente ao avaliar o Gemini 2.5 Pro.

1. Raciocínio estruturado e transparente – um novo padrão de clareza de pensamento

O que diferencia o Gemini 2.5 Pro não é apenas sua inteligência, mas como essa inteligência demonstra claramente seu trabalho. O método de treinamento passo a passo do Google cria um trem de pensamento estruturado (CoT) que não se assemelha a divagações ou suposições, como o que vimos em modelos como o DeepSeek . Esses CoTs não são truncados em resumos superficiais como os modelos da OpenAI. O novo modelo Gemini apresenta ideias em etapas numeradas, com subtópicos e lógica interna extremamente clara e transparente.

Em termos práticos, isso é um avanço em confiabilidade e navegabilidade. Usuários empresariais que avaliam resultados para tarefas críticas – como revisar implicações de políticas, codificar lógica ou resumir pesquisas complexas – agora podem ver como o modelo chegou à resposta. Isso significa que eles podem validar, corrigir ou redirecionar as respostas com mais confiança. Este é um grande passo à frente em relação à sensação de "caixa preta" que ainda persiste em muitas saídas de modelos de grandes linguagens (LLM) .

Para um guia mais detalhado sobre o desempenho deste modelo, confira o vídeo onde o Gemini 2.5 Pro é testado ao vivo. Um exemplo discutido: quando questionado sobre as limitações de grandes modelos de linguagem, o Gemini 2.5 Pro demonstrou notável consciência. Ele descreve as fraquezas comuns e as categoriza em áreas como “intuição física”, “síntese de novos conceitos”, “planejamento de longo prazo” e “nuance ética”, fornecendo uma estrutura que ajuda os usuários a entender o que o modelo sabe e como abordar o problema.

As equipes de engenharia empresarial podem aproveitar essa capacidade para:

  • Depurar cadeias lógicas complexas em aplicações de missão crítica
  • Melhor compreensão das limitações do modelo em domínios específicos
  • Fornecer decisões mais transparentes habilitadas por IA às partes interessadas
  • Melhorar o seu próprio pensamento crítico estudando a abordagem do modelo

Uma limitação notável é que, embora esse raciocínio estruturado esteja disponível no aplicativo Gemini e no Google AI Studio, ele não está acessível atualmente via API — uma deficiência para desenvolvedores que buscam integrar esse recurso em aplicativos corporativos.

2. Um verdadeiro concorrente à tecnologia de ponta – não apenas na teoria

O modelo atualmente lidera a tabela de classificação do Chatbot Arena por uma margem significativa — mais de 35 pontos Elo à frente do próximo melhor modelo, principalmente a atualização OpenAI 4o lançada um dia após o lançamento do Gemini 2.5 Pro. E embora o domínio dos benchmarks geralmente seja passageiro (já que novos modelos são lançados semanalmente), o Gemini 2.5 Pro realmente parece diferente.

Google afirma que Gemini 2.5 supera os melhores modelos da OpenAI, DeepSeek e outros gigantes da tecnologia de IA

Ele se destaca em tarefas que recompensam o raciocínio profundo: codificação, resolução de problemas com nuances, resumo em documentos e até mesmo planejamento abstrato. Em testes internos, ele teve um desempenho particularmente bom em benchmarks anteriormente difíceis, como o “Último Exame da Humanidade”, um benchmark popular para detectar fraquezas de LLM em áreas abstratas e diferenciadas.

Grupos empresariais podem não se importar com qual modelo vence qual classificação acadêmica. Mas eles se importarão que esse modelo possa pensar - e mostrarão como ele pensa. O teste de vibração é muito importante.

Como observou o respeitado engenheiro de IA Nathan Lambert: “O Google tem os melhores modelos novamente, porque eles deveriam ter iniciado todo esse boom da IA. O grande erro foi corrigido.” Os usuários empresariais devem ver isso não apenas como uma tentativa do Google de alcançar os concorrentes, mas também de superá-los em recursos importantes para aplicativos empresariais.

3. Finalmente, o jogo de criptografia do Google é forte

Tradicionalmente, o Google ficou atrás do OpenAI e do Anthropic em termos de suporte de codificação focado no desenvolvedor. O Gemini 2.5 Pro muda isso.

Em testes práticos, ele demonstrou fortes capacidades de tentativa única em desafios de codificação, incluindo a construção de um jogo Tetris funcional que rodou na primeira tentativa quando exportado para o Replit — sem necessidade de depuração. Mais notavelmente, ele explica claramente a estrutura do código, rotula cuidadosamente as variáveis ​​e etapas e apresenta sua abordagem antes de escrever uma única linha de código.

Este modelo compete com o Claude 3.7 Sonnet da Anthropic, que é considerado líder em geração de código e é um dos principais motivos do sucesso da Anthropic na empresa. Mas o Gemini 2.5 oferece uma vantagem importante: uma enorme janela de contexto de token de até 1 milhão. Claude 3.7 Sonnet atualmente oferece apenas 500.000 tokens.

Essa grande janela de contexto abre novas possibilidades de raciocínio em toda a base de código, leitura de documentação on-line e trabalho em vários arquivos interdependentes. A experiência do engenheiro de software Simon Willison demonstra essa vantagem.

Ao usar o Gemini 2.5 Pro para implementar um novo recurso em nossa base de código, o modelo identificou as alterações necessárias em 18 arquivos diferentes e concluiu o projeto inteiro em cerca de 45 minutos, com média de menos de 3 minutos por arquivo modificado. Esta é uma ferramenta séria para empresas que estão experimentando estruturas de agentes ou ambientes de desenvolvimento com tecnologia de IA.

4. Integração multimétodo com comportamento semelhante ao de um agente

Enquanto alguns modelos, como o mais recente 4o da OpenAI, podem mostrar mais brilho com geração de imagens atraentes, o Gemini 2.5 Pro parece estar redefinindo silenciosamente o que é o raciocínio multimodal fundamentado.

Em um exemplo, um experimento prático de Ben Dickson para a VentureBeat demonstrou a capacidade do modelo de extrair informações importantes de um artigo técnico sobre algoritmos de pesquisa e gerar um diagrama de fluxo SVG correspondente — e então melhorar esse diagrama de fluxo quando lhe for mostrada uma versão renderizada com erros visuais. Esse nível de raciocínio multimodal permite a criação de novos fluxos de trabalho que antes não eram possíveis com modelos somente de texto.

Em outro exemplo, o desenvolvedor Sam Witteveen enviou uma captura de tela simples de um mapa de Las Vegas e perguntou quais eventos do Google estavam acontecendo nas proximidades em 9 de abril. O modelo identificou o local, inferiu a intenção do usuário, pesquisou online e retornou detalhes precisos sobre o Google Cloud Next, incluindo data, local e citação. Tudo isso é feito sem uma estrutura de agente personalizada, apenas o modelo principal e a pesquisa integrada.

Na verdade, esse modelo de raciocínio de entrada multimodal vai além de apenas olhar. Ele sugere como seria um fluxo de trabalho empresarial em 6 meses: carregue documentos, diagramas e painéis e deixe o modelo sintetizar, planejar ou tomar ações significativas com base no conteúdo.

Sign up and earn $1000 a day ⋙

Leave a Comment

O Gmail adiciona uma marca de seleção azul para verificar remetentes “respeitáveis”

O Gmail adiciona uma marca de seleção azul para verificar remetentes “respeitáveis”

Durante muito tempo, com o desenvolvimento e a popularidade das plataformas de redes sociais, o "tique azul" gradualmente se tornou um dos personagens mais poderosos do mundo da internet.

O Chromecast está oficialmente morto

O Chromecast está oficialmente morto

A linha Chromecast do Google é há muito tempo uma escolha popular se você deseja substituir sua experiência de smart TV ou transformar qualquer TV em uma smart TV.

Google adiciona recurso para abrir aplicativos automaticamente após instalação na Play Store

Google adiciona recurso para abrir aplicativos automaticamente após instalação na Play Store

O Google está adicionando um novo recurso pequeno, mas muito aguardado, à Play Store.

Google anuncia Android XR, uma nova plataforma de sistema operacional para óculos de realidade aumentada e realidade virtual

Google anuncia Android XR, uma nova plataforma de sistema operacional para óculos de realidade aumentada e realidade virtual

Após anos de negligência, o Google finalmente decidiu redirecionar seus investimentos em dispositivos de realidade estendida (XR), como fones de ouvido e óculos.

Qual fabricante de smartphones tem as melhores atualizações do Android?

Qual fabricante de smartphones tem as melhores atualizações do Android?

Existem muitos fabricantes de Android, mas nem todos prestam atenção às atualizações de software. Embora a situação tenha melhorado na última década, nem todos os fabricantes de smartphones oferecem ótimo suporte de software.

Gemini, do Google, responde com palavras estranhas e sem sentido repetidas a alguns usuários

Gemini, do Google, responde com palavras estranhas e sem sentido repetidas a alguns usuários

Recentemente, alguns usuários notaram que o Google Gemini tem apresentado textos repetitivos, caracteres estranhos e informações completamente sem sentido em algumas respostas.

Google remove acesso Gemini do aplicativo do Google para iPhone

Google remove acesso Gemini do aplicativo do Google para iPhone

O aplicativo do Google para iPhone está prestes a se tornar um pouco menos útil, já que o Google removeu recentemente o acesso ao Gemini AI desse aplicativo.

O que acontece se você perder sua conta do Google?

O que acontece se você perder sua conta do Google?

Perder o acesso à sua conta do Google pode ter consequências sérias, além de não conseguir enviar e receber e-mails.

Google lança recurso de criação de vídeos com IA no Gemini

Google lança recurso de criação de vídeos com IA no Gemini

O Google acaba de anunciar que os usuários agora podem criar vídeos usando inteligência artificial por meio do chatbot Gemini e da ferramenta experimental Whisk, lançada recentemente.

Google lança o Career Dreamer, sua mais nova ferramenta de IA para ajudar a escolher a carreira perfeita

Google lança o Career Dreamer, sua mais nova ferramenta de IA para ajudar a escolher a carreira perfeita

Não importa se você está dando os primeiros passos no mercado de trabalho ou fazendo a transição para um novo setor, o Career Dreamer experimental do Google foi criado para conectar você a funções compatíveis.

Google desenvolve ferramenta de compras com IA que permite aos usuários experimentar vestidos e camisas em casa

Google desenvolve ferramenta de compras com IA que permite aos usuários experimentar vestidos e camisas em casa

No ano passado, o Google introduziu um assistente de compras com tecnologia de IA na Pesquisa que permite aos usuários ter uma ideia visual de como uma peça de roupa ficaria em um tipo de corpo específico.

Google desenvolve algoritmo de IA que pode diagnosticar doenças de pele e tuberculose

Google desenvolve algoritmo de IA que pode diagnosticar doenças de pele e tuberculose

O Google vem demonstrando cada vez mais interesse no campo de aplicações de inteligência artificial na medicina.

Google confirma problema com Chromecast de segunda geração e Chromecast Audio

Google confirma problema com Chromecast de segunda geração e Chromecast Audio

Após alguns dias de confusão, o Google confirmou oficialmente o problema com o Chromecast de segunda geração e o Chromecast Audio.

Google publicou acidentalmente documentação sobre como a pesquisa funciona

Google publicou acidentalmente documentação sobre como a pesquisa funciona

Na segunda-feira, documentos internos descrevendo os fatores que o Google Search considera ao classificar e exibir resultados da web vazaram.

Como ativar e usar o Google Assistente no Chrome para Android

Como ativar e usar o Google Assistente no Chrome para Android

O Google está gradualmente eliminando sua antiga tecnologia de reconhecimento de voz e substituindo-a por seu assistente virtual Assistant.

Os melhores laptops para estudantes em 2025

Os melhores laptops para estudantes em 2025

Os alunos precisam de um tipo específico de laptop para seus estudos. Ele não deve apenas ser potente o suficiente para um bom desempenho na área de estudo escolhida, mas também compacto e leve o suficiente para ser carregado o dia todo.

Como adicionar uma impressora ao Windows 10

Como adicionar uma impressora ao Windows 10

Adicionar uma impressora ao Windows 10 é simples, embora o processo para dispositivos com fio seja diferente do que para dispositivos sem fio.

Como verificar a RAM e verificar erros de RAM no seu computador com a maior taxa de precisão

Como verificar a RAM e verificar erros de RAM no seu computador com a maior taxa de precisão

Como você sabe, a RAM é um componente de hardware muito importante em um computador, atuando como memória para processar dados e é o fator que determina a velocidade de um laptop ou PC. No artigo abaixo, o WebTech360 apresentará algumas maneiras de verificar erros de RAM usando software no Windows.

Diferença entre TV comum e Smart TV

Diferença entre TV comum e Smart TV

As Smart TVs realmente conquistaram o mundo. Com tantos recursos excelentes e conectividade à Internet, a tecnologia mudou a maneira como assistimos TV.

Por que o freezer não tem luz, mas a geladeira tem?

Por que o freezer não tem luz, mas a geladeira tem?

Geladeiras são eletrodomésticos comuns em residências. As geladeiras geralmente têm 2 compartimentos, o compartimento frio é espaçoso e tem uma luz que acende automaticamente toda vez que o usuário o abre, enquanto o compartimento do freezer é estreito e não tem luz.

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

As redes Wi-Fi são afetadas por muitos fatores além de roteadores, largura de banda e interferência, mas existem algumas maneiras inteligentes de melhorar sua rede.

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Se você quiser voltar para o iOS 16 estável no seu telefone, aqui está o guia básico para desinstalar o iOS 17 e fazer o downgrade do iOS 17 para o 16.

O que acontece com o corpo quando você come iogurte todos os dias?

O que acontece com o corpo quando você come iogurte todos os dias?

Iogurte é um alimento maravilhoso. É bom comer iogurte todos os dias? Quando você come iogurte todos os dias, como seu corpo muda? Vamos descobrir juntos!

Que tipo de arroz é melhor para a saúde?

Que tipo de arroz é melhor para a saúde?

Este artigo discute os tipos de arroz mais nutritivos e como maximizar os benefícios para a saúde de qualquer arroz que você escolher.

Como acordar na hora certa pela manhã

Como acordar na hora certa pela manhã

Estabelecer um horário de sono e uma rotina para dormir, mudar o despertador e ajustar a dieta são algumas das medidas que podem ajudar você a dormir melhor e acordar na hora certa pela manhã.

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Alugue, por favor! Landlord Sim é um jogo de simulação para dispositivos móveis para iOS e Android. Você jogará como proprietário de um complexo de apartamentos e começará a alugar um apartamento com o objetivo de reformar o interior do seu apartamento e deixá-lo pronto para inquilinos.

Últimos códigos de defesa de torre de banheiro e como inseri-los

Últimos códigos de defesa de torre de banheiro e como inseri-los

Obtenha o código do jogo Bathroom Tower Defense Roblox e resgate recompensas emocionantes. Elas ajudarão você a melhorar ou desbloquear torres com maior dano.

Estrutura, símbolos e princípios de funcionamento dos transformadores

Estrutura, símbolos e princípios de funcionamento dos transformadores

Vamos aprender sobre a estrutura, os símbolos e os princípios de operação dos transformadores da maneira mais precisa.

4 maneiras pelas quais a IA está melhorando as Smart TVs

4 maneiras pelas quais a IA está melhorando as Smart TVs

De melhor qualidade de imagem e som a controle de voz e muito mais, esses recursos com tecnologia de IA estão tornando as smart TVs muito melhores!

Por que o ChatGPT é melhor que o DeepSeek

Por que o ChatGPT é melhor que o DeepSeek

Inicialmente, as pessoas tinham grandes esperanças no DeepSeek. Como um chatbot de IA comercializado como um forte concorrente do ChatGPT, ele promete recursos e experiências de bate-papo inteligentes.