9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

Com LLMs quânticos agora disponíveis no HuggingFace e ecossistemas de IA como H20, Text Gen e GPT4All permitindo que você carregue pesos de LLM no seu computador, agora você tem uma opção de IA gratuita, flexível e segura. Aqui estão os 9 melhores LLMs locais/offline que você pode experimentar agora mesmo!

Índice

1. Hermes 2 Pro GPTQ

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

Hermes 2 Pro é um modelo de linguagem avançado aprimorado pela Nous Research. Ele usa uma versão atualizada e simplificada do conjunto de dados OpenHermes 2.5, juntamente com os novos conjuntos de dados Function Calling e JSON desenvolvidos pela própria empresa. Este modelo é baseado na arquitetura Mistral 7B e foi treinado em 1.000.000 de instruções/conversas de qualidade GPT-4 ou melhor, principalmente dados sintéticos.

Modelo

Hermes 2 Pro GPTQ

Tamanho do modelo

7,26 GB

Parâmetros

7 bilhões

Quantização

4 bits

Tipo

Mistral

Licença

Apache 2.0

O Hermes 2 Pro no Mistral 7B é o novo modelo principal do Hermes 7B, oferecendo desempenho aprimorado em uma variedade de benchmarks, incluindo AGIEval, BigBench Reasoning, GPT4All e TruthfulQA. Seus recursos avançados o tornam adequado para muitas tarefas de processamento de linguagem natural (PLN), como geração de código, criação de conteúdo e aplicativos de IA conversacional.

2. Zephyr 7B Beta

Zephyr é uma série de modelos de linguagem treinados para atuar como assistentes úteis. Zephyr-7B-Beta é o segundo modelo da série, refinado a partir do Mistral-7B-v0.1 usando Otimização de Preferência Direta (DPO) em uma mistura de conjuntos de dados sintéticos disponíveis publicamente.

Modelo

Zephyr 7B Beta

Tamanho do modelo

7,26 GB

Parâmetros

7 bilhões

Quantização

4 bits

Tipo

Mistral

Licença

Apache 2.0

Ao eliminar o alinhamento interno de conjuntos de dados de treinamento, o Zephyr-7B-Beta demonstra desempenho aprimorado em benchmarks como o MT-Bench, aumentando sua utilidade em uma variedade de tarefas. No entanto, esse ajuste pode levar à geração problemática de texto quando solicitado de determinadas maneiras.

3. Falcon Instruir GPTQ

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

Esta versão quantizada do Falcon é baseada em uma arquitetura somente decodificadora refinada no modelo bruto Falcon-7b do TII. O modelo base do Falcon é treinado usando 1,5 trilhão de tokens pendentes provenientes da Internet pública. Como um modelo somente de decodificador baseado em comando licenciado pelo Apache 2, o Falcon Instruct é perfeito para pequenas empresas que buscam um modelo para usar em tradução de idiomas e ingestão de dados.

Modelo

Falcon-7B-Instruct

Tamanho do modelo

7,58 GB

Parâmetros

7 bilhões

Quantização

4 bits

Tipo

Falcão

Licença

Apache 2.0

Entretanto, esta versão do Falcon não é ideal para ajustes finos e serve apenas para inferência. Se quiser ajustar o Falcon, você terá que usar o modelo bruto, o que pode exigir acesso a hardware de treinamento de nível empresarial, como NVIDIA DGX ou AMD Instinct AI Accelerators.

4. GPT4ALL-J Groovy

GPT4All-J Groovy é um modelo somente decodificador ajustado pela Nomic AI e licenciado sob Apache 2.0. O GPT4ALL-J Groovy é baseado no modelo original GPT-J, que é conhecido por ser ótimo em gerar texto a partir de prompts. GPT4ALL -J Groovy foi ajustado para um modelo de conversação, o que é ótimo para aplicações de geração de texto rápidas e criativas. Isso torna o GPT4All-J Groovy ideal para criadores de conteúdo, auxiliando-os na escrita e composição de poesias, músicas ou histórias.

Modelo

GPT4ALL-J Groovy

Tamanho do modelo

3,53 GB

Parâmetros

7 bilhões

Quantização

4 bits

Tipo

GPT-J

Licença

Apache 2.0

Infelizmente, o modelo GPT-J de base foi treinado em um conjunto de dados somente em inglês, o que significa que mesmo esse modelo GPT4ALL-J ajustado só consegue conversar e executar aplicações de geração de texto em inglês.

5. Instrutor do DeepSeek Coder V2

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

O DeepSeek Coder V2 é um modelo de linguagem avançado que aprimora a programação e o raciocínio matemático. O DeepSeek Coder V2 suporta diversas linguagens de programação e oferece comprimento de contexto estendido, tornando-o uma ferramenta versátil para desenvolvedores.

Modelo

Instrutor do DeepSeek Coder V2

Tamanho do modelo

13 GB

Parâmetros

33 bilhões

Quantização

4 bits

Tipo

Busca Profunda

Licença

Apache 2.0

Comparado ao seu antecessor, o DeepSeek Coder V2 mostra melhorias significativas em tarefas relacionadas a código, raciocínio e capacidades gerais. Ele estende o suporte para linguagens de programação de 86 para 338 e estende o comprimento do contexto de 16K para 128K tokens. Em benchmarks, ele supera modelos como GPT-4 Turbo, Claude 3 Opus e Gemini 1.5 Pro em benchmarks criptográficos e matemáticos.

6. Mixtral-8x7B

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

Mixtral-8x7B é uma mistura de modelos especialistas (MoE) desenvolvida pela Mistral AI. Possui 8 especialistas por MLP, totalizando 45 bilhões de parâmetros. No entanto, apenas dois especialistas são ativados por token durante a inferência, tornando-a computacionalmente eficiente, com velocidade e custo comparáveis ​​a um modelo de 12 bilhões de parâmetros.

Modelo

Mixtral-8x7B

Tamanho do modelo

12 GB

Parâmetros

45 bilhões (8 especialistas)

Quantização

4 bits

Tipo

Mistral MoE

Licença

Apache 2.0

O Mixtral suporta um comprimento de contexto de 32 mil tokens e supera o Llama 2 em 70 bilhões na maioria dos benchmarks, igualando ou excedendo o desempenho do GPT-3.5. Ele é fluente em vários idiomas, incluindo inglês, francês, alemão, espanhol e italiano, o que o torna uma escolha versátil para uma variedade de tarefas de PNL.

7. Wizard Vicuna sem censura-GPTQ

Wizard-Vicunha GPTQ é a versão quântica do Wizard Vicuna baseada no modelo LlaMA. Diferentemente da maioria dos LLMs lançados ao público, Wizard-Vicunha é um modelo sem censura e com a associação removida. Isso significa que o modelo não tem os mesmos padrões de segurança e éticos que a maioria dos outros modelos.

Modelo

Wizard-Vicuna-30B-Sem Censura-GPTQ

Tamanho do modelo

16,94 GB

Parâmetros

30 bilhões

Quantização

4 bits

Tipo

LlaMA

Licença

GPL 3

Embora possa representar um problema para o controle de alinhamento da IA, ter um LLM sem censura também traz o melhor do modelo, permitindo que ele responda sem quaisquer restrições. Isso também permite que os usuários adicionem seu próprio alinhamento personalizado sobre como a IA deve agir ou responder com base em um determinado prompt.

8. Orca Mini-GPTQ

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

Você quer testar um modelo treinado usando um método de aprendizado exclusivo? Orca Mini é uma implementação não oficial do artigo de pesquisa Orca da Microsoft. Este modelo é treinado usando uma abordagem de aprendizagem professor-aluno, onde o conjunto de dados é preenchido com explicações em vez de apenas avisos e respostas. Em teoria, isso deve tornar o aluno mais inteligente, pois o modelo pode entender o problema em vez de apenas procurar pares de entrada e saída, como funciona o LLM convencional.

9. Llama 2 13B Chat GPTQ

9 Melhores LLMs Locais/Offline que Você Pode Experimentar Agora Mesmo

O Llama 2 é o sucessor do Llama LLM original, oferecendo melhor desempenho e versatilidade. A variante 13B Chat GPTQ é ajustada para aplicativos de IA de conversação otimizados para diálogos em inglês.

Alguns dos modelos listados acima vêm em diversas versões em termos de especificações. Em geral, versões com especificações mais altas produzem resultados melhores, mas exigem hardware mais potente, enquanto versões com especificações mais baixas produzem resultados de menor qualidade, mas podem ser executadas em hardware de baixo custo. Se você não tiver certeza se seu PC pode executar este modelo, tente primeiro uma versão com especificações mais baixas e depois continue até sentir que a queda de desempenho não é mais aceitável.

Sign up and earn $1000 a day ⋙

Leave a Comment

Os melhores laptops para estudantes em 2025

Os melhores laptops para estudantes em 2025

Os alunos precisam de um tipo específico de laptop para seus estudos. Ele não deve apenas ser potente o suficiente para um bom desempenho na área de estudo escolhida, mas também compacto e leve o suficiente para ser carregado o dia todo.

Como adicionar uma impressora ao Windows 10

Como adicionar uma impressora ao Windows 10

Adicionar uma impressora ao Windows 10 é simples, embora o processo para dispositivos com fio seja diferente do que para dispositivos sem fio.

Como verificar a RAM e verificar erros de RAM no seu computador com a maior taxa de precisão

Como verificar a RAM e verificar erros de RAM no seu computador com a maior taxa de precisão

Como você sabe, a RAM é um componente de hardware muito importante em um computador, atuando como memória para processar dados e é o fator que determina a velocidade de um laptop ou PC. No artigo abaixo, o WebTech360 apresentará algumas maneiras de verificar erros de RAM usando software no Windows.

Diferença entre TV comum e Smart TV

Diferença entre TV comum e Smart TV

As Smart TVs realmente conquistaram o mundo. Com tantos recursos excelentes e conectividade à Internet, a tecnologia mudou a maneira como assistimos TV.

Por que o freezer não tem luz, mas a geladeira tem?

Por que o freezer não tem luz, mas a geladeira tem?

Geladeiras são eletrodomésticos comuns em residências. As geladeiras geralmente têm 2 compartimentos, o compartimento frio é espaçoso e tem uma luz que acende automaticamente toda vez que o usuário o abre, enquanto o compartimento do freezer é estreito e não tem luz.

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

As redes Wi-Fi são afetadas por muitos fatores além de roteadores, largura de banda e interferência, mas existem algumas maneiras inteligentes de melhorar sua rede.

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Se você quiser voltar para o iOS 16 estável no seu telefone, aqui está o guia básico para desinstalar o iOS 17 e fazer o downgrade do iOS 17 para o 16.

O que acontece com o corpo quando você come iogurte todos os dias?

O que acontece com o corpo quando você come iogurte todos os dias?

Iogurte é um alimento maravilhoso. É bom comer iogurte todos os dias? Quando você come iogurte todos os dias, como seu corpo muda? Vamos descobrir juntos!

Que tipo de arroz é melhor para a saúde?

Que tipo de arroz é melhor para a saúde?

Este artigo discute os tipos de arroz mais nutritivos e como maximizar os benefícios para a saúde de qualquer arroz que você escolher.

Como acordar na hora certa pela manhã

Como acordar na hora certa pela manhã

Estabelecer um horário de sono e uma rotina para dormir, mudar o despertador e ajustar a dieta são algumas das medidas que podem ajudar você a dormir melhor e acordar na hora certa pela manhã.

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Alugue, por favor! Landlord Sim é um jogo de simulação para dispositivos móveis para iOS e Android. Você jogará como proprietário de um complexo de apartamentos e começará a alugar um apartamento com o objetivo de reformar o interior do seu apartamento e deixá-lo pronto para inquilinos.

Últimos códigos de defesa de torre de banheiro e como inseri-los

Últimos códigos de defesa de torre de banheiro e como inseri-los

Obtenha o código do jogo Bathroom Tower Defense Roblox e resgate recompensas emocionantes. Elas ajudarão você a melhorar ou desbloquear torres com maior dano.

Estrutura, símbolos e princípios de funcionamento dos transformadores

Estrutura, símbolos e princípios de funcionamento dos transformadores

Vamos aprender sobre a estrutura, os símbolos e os princípios de operação dos transformadores da maneira mais precisa.

4 maneiras pelas quais a IA está melhorando as Smart TVs

4 maneiras pelas quais a IA está melhorando as Smart TVs

De melhor qualidade de imagem e som a controle de voz e muito mais, esses recursos com tecnologia de IA estão tornando as smart TVs muito melhores!

Por que o ChatGPT é melhor que o DeepSeek

Por que o ChatGPT é melhor que o DeepSeek

Inicialmente, as pessoas tinham grandes esperanças no DeepSeek. Como um chatbot de IA comercializado como um forte concorrente do ChatGPT, ele promete recursos e experiências de bate-papo inteligentes.