Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

Na I/O 2024, o Google anunciou sua próxima linha de modelos Gemma 2, e agora a empresa está finalmente lançando os modelos leves sob uma licença de código aberto. Dizem que o novo modelo Gemma 2 27B é muito promissor, superando alguns modelos maiores, como o Llama 3 70B e o Qwen 1.5 32B. Então, para testar essa afirmação, vamos comparar o Gemma 2 e o Llama 3, dois dos principais modelos de código aberto da atualidade.

Escrita criativa

Primeiro, vamos conferir o quão bons Gemma 2 e Llama 3 são quando se trata de escrita criativa. O autor do artigo pediu que ambas as modelos escrevessem uma pequena história sobre a relação entre a lua e o sol. Ambos fazem um ótimo trabalho, mas o modelo Gemma 2 do Google se destaca graças à sua prosa envolvente e boa história.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

Por outro lado, Llama 3 parece um pouco sem graça e robótico. O Google sempre foi bom na geração de texto com modelos Gemini e o menor Gemma 2 27B não é exceção.

Opção vencedora: Gemma 2

Testes multilíngues

Na próxima rodada, vamos ver o quão bem ambos os modelos lidam com idiomas diferentes do inglês. Como o Google anuncia que o Gemma 2 é bom em entender vários idiomas, o autor o comparou ao modelo Llama 3 do Meta. O autor pediu que ambos os modelos traduzissem uma passagem em hindi. Tanto Gemma 2 quanto Llama 3 tiveram um ótimo desempenho.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

O autor também tentou outro idioma, o bengali, e os modelos deram resultados igualmente bons. Pelo menos para as línguas indianas, pode-se dizer que Gemma 2 e Llama 3 são bem treinadas em um grande corpus. No entanto, o Gemma 2 27B é quase 2,5 vezes menor que o Llama 3 70B, o que o torna ainda mais impressionante.

Opções vencedoras: Gemma 2 e Llama 3

Verifique a lógica

Embora o Gemma 2 e o Llama 3 não sejam os modelos mais inteligentes do mercado, eles podem realizar alguns testes de raciocínio comuns, assim como modelos muito maiores. Na comparação anterior entre o Llama 3 e o GPT-4 , o modelo 70B da Meta foi impressionante, pois demonstrou uma inteligência muito boa mesmo em seu tamanho menor.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

Nesta rodada, Llama 3 derrotou Gemma 2 com uma grande diferença de pontuação. Llama 3 respondeu corretamente a 2 de 3 perguntas, enquanto Gemma 2 teve dificuldade para responder a pelo menos uma. Gemma 2 simplesmente não é treinada para resolver questões de raciocínio complexas.

Por outro lado, o Llama 3 tem uma base de raciocínio sólida, que provavelmente pode ser inferida a partir do conjunto de dados criptografados. Apesar de seu pequeno tamanho — pelo menos comparado a modelos de trilhões de parâmetros como o GPT-4 — ele exibe um nível de inteligência mais do que razoável. No final das contas, usar mais tokens para treinar o modelo resulta em um modelo mais poderoso.

Opção vencedora: Lhama 3

Siga as instruções

Na próxima rodada, o autor pediu que Gemma 2 e Llama 3 criassem 10 palavras que terminassem com a palavra “NPU”. E o Llama 3 acertou 10/10 respostas. Em contraste, o Gemma 2 produziu apenas 7 frases corretas de 10. Em muitas versões anteriores, os modelos do Google, incluindo o Gemini, não seguiram bem as instruções do usuário. E a mesma tendência continua com Gemma 2.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

Seguir as instruções do usuário é crucial para modelos de IA. Ela garante confiabilidade e gera feedback preciso sobre o que você instruiu. Do lado da segurança, ele também ajuda a manter o modelo aterrado para melhor conformidade com os protocolos de segurança.

Opção vencedora: Lhama 3

Encontre informações

Tanto Gemma 2 quanto Llama 3 têm um comprimento de contexto de 8K tokens. O autor adicionou um enorme bloco de texto, extraído diretamente do livro Orgulho e Preconceito, contendo mais de 17.000 caracteres e 3,8 mil tokens. Como sempre, o autor coloca uma citação aleatória em algum lugar do texto e pede que ambas as modelos a encontrem.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

Gemma 2 rapidamente descobriu a informação e apontou que a citação foi inserida aleatoriamente. Llama 3 também descobriu e sugeriu que essa afirmação parecia fora de lugar. Em termos de memória de contexto longo, embora limitada a 8K tokens, ambos os modelos são bastante fortes nesse aspecto.

Observe que o autor executou este teste no HuggingChat (web) porque o meta.ai se recusou a executar este prompt, provavelmente devido a conteúdo protegido por direitos autorais.

Opções vencedoras: Gemma 2 e Llama 3

Verifique se há alucinações

Modelos menores tendem a sofrer de alucinações de IA devido a dados de treinamento limitados, muitas vezes fabricando informações quando o modelo encontra tópicos desconhecidos. Então o autor usou seu nome de país inventado para testar se Gemma 2 e Llama 3 estavam tendo alucinações. E, surpreendentemente, não o fizeram, o que significa que tanto o Google quanto o Meta têm uma base muito boa para seus modelos.

Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?
Gemma 2 ou Llama 3 é o melhor modelo de código aberto?

O autor também levantou outra questão (falsa) para testar a validade dos modelos, mas, novamente, eles não eram alucinógenos. A propósito, o autor testou o Llama 3 no HuggingChat enquanto o meta.ai navegava na Internet em busca de informações atualizadas sobre tópicos relevantes.

Opções vencedoras: Gemma 2 e Llama 3

Concluir

Embora o modelo Gemma 2 27B do Google não tenha um bom desempenho em testes de raciocínio, ele é capaz de realizar uma série de outras tarefas. É ótimo para escrita criativa, suporta vários idiomas, tem boa memória e, acima de tudo, não é tão alucinógeno quanto os modelos anteriores.

O Llama 3 é melhor, claro, mas também é um modelo significativamente maior, treinado em 70 bilhões de parâmetros. Os desenvolvedores acharão o modelo Gemma 2 27B útil para uma ampla variedade de casos de uso. E para garantir, a Gemma 2 9B também está disponível.

Além disso, os usuários devem conferir o Gemini 1.5 Flash, que também é um modelo muito menor e suporta entrada multimodal. Sem mencionar que é incrivelmente rápido e eficiente.

Sign up and earn $1000 a day ⋙

Leave a Comment

Instruções sobre como jogar Zuka Lien Quan Mobile temporada S1 2023

Instruções sobre como jogar Zuka Lien Quan Mobile temporada S1 2023

Zuka é um assassino conhecido por aterrorizar campeões com pouca vida. Aprenda a usar Zuka de forma eficaz na temporada 23.

Último código da Heroic Era e como resgatar o código

Último código da Heroic Era e como resgatar o código

Receber presentes por meio de códigos de presente da Heroic Age é o que quase todos os novos jogadores fazem ao entrar no jogo.

8 provedores de armazenamento em nuvem mais baratos

8 provedores de armazenamento em nuvem mais baratos

Vamos dar uma olhada nas opções de armazenamento em nuvem on-line mais baratas disponíveis. Este artigo analisará os preços em termos absolutos e por gigabyte (por mês) para que você possa escolher o que é melhor para você.

O que é o erro do sinal de libra (####) no Excel?

O que é o erro do sinal de libra (####) no Excel?

#### no Excel é um erro comum do Excel e aparece em muitos casos diferentes quando inserimos dados no Excel, funções no Excel, inserimos fórmulas no Excel.

12 configurações em telefones Samsung Galaxy que você deve alterar

12 configurações em telefones Samsung Galaxy que você deve alterar

Acabou de comprar um telefone Samsung Galaxy e precisa configurá-lo? Aqui estão 10 configurações que você deve alterar para que seu telefone Samsung funcione melhor.

Últimos códigos do Murder Mystery 2 e como entrar

Últimos códigos do Murder Mystery 2 e como entrar

Code Murder Mystery 2 ajuda os jogadores a escolher mais skins de faca para seus personagens ou a obter mais dinheiro para usar em serviços e comprar outras coisas no jogo.

28 lindos designs de cartões de aniversário com bons desejos para pais, cônjuges, amantes e amigos

28 lindos designs de cartões de aniversário com bons desejos para pais, cônjuges, amantes e amigos

No aniversário do seu amor, pais, amigos, irmãos, colegas... além de presentes, não se esqueça de enviar cartões de aniversário com desejos.

Enigmas engraçados, mas doces, para flertar e que vão conquistar o coração da sua paixão

Enigmas engraçados, mas doces, para flertar e que vão conquistar o coração da sua paixão

Esses testes divertidos ajudarão você a causar uma boa impressão e conquistar o coração da pessoa que você gosta de forma rápida e feliz.

Temporada 7 do Corki DTCL: Itens de construção, esquadrão padrão de artilheiros de Corki

Temporada 7 do Corki DTCL: Itens de construção, esquadrão padrão de artilheiros de Corki

Corki DTCL temporada 7 precisa de proteção ou suporte para causar controle se ele quiser ficar livre para destruir o time inimigo. Ao mesmo tempo, o equipamento de Corki também deve ser padrão para poder causar danos mais eficazes.

Como baixar Mini World Royale e instruções de como jogar

Como baixar Mini World Royale e instruções de como jogar

Aqui está o link para download do Mini World Royale e as instruções para jogar, teremos duas versões: Mini World Royale APK e Mini World Royale iOS.

O que é 1314?

O que é 1314?

1314 é um número frequentemente usado pelos jovens como um código de amor. No entanto, nem todo mundo sabe o que é 1314 e o que significa?

Como proteger sua saúde mental e física em um ambiente tóxico

Como proteger sua saúde mental e física em um ambiente tóxico

Lidar com situações tóxicas pode ser incrivelmente difícil. Aqui estão algumas dicas para ajudar você a lidar com ambientes tóxicos com tato e manter a paz de espírito.

Maneiras como a música estimula o cérebro

Maneiras como a música estimula o cérebro

A maioria das pessoas sabe que a música não serve apenas para entretenimento, mas tem muitos outros benefícios. Aqui estão algumas maneiras pelas quais a música estimula o desenvolvimento do nosso cérebro.

Os nutrientes mais comumente deficientes na dieta

Os nutrientes mais comumente deficientes na dieta

A dieta é muito importante para nossa saúde. No entanto, a maioria das nossas dietas muitas vezes carece desses seis nutrientes importantes.

Como usar o aplicativo CK Club do Circle K para receber ofertas atraentes

Como usar o aplicativo CK Club do Circle K para receber ofertas atraentes

Para obter as informações promocionais mais rápidas do Circle K, você deve instalar o aplicativo CK Club. O aplicativo salva os pagamentos feitos em compras ou pagamentos no Circle K, bem como o número de selos coletados.