Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

A startup chinesa de IA DeepSeek acaba de lançar oficialmente seu mais recente modelo de grande linguagem (LLM), DeepSeek-V3-0324. Com capacidade de até 641 GB, este modelo foi anunciado na plataforma AI Hugging Face sem que muitas informações fossem reveladas, seguindo o estilo sigiloso sobre novos produtos que a empresa sempre aplicou até então.

O diferencial desse modelo é a licença MIT, que permite o uso gratuito para fins comerciais. Os resultados iniciais do benchmark mostram que o DeepSeek-V3-0324 é capaz de rodar em configurações de hardware convencionais, como o Mac Studio da Apple com o chip M3 Ultra. O cientista de IA Awni Hannun relatou que era possível atingir velocidades de processamento de mais de 20 tokens por segundo usando essa configuração. Essa capacidade de executar um grande modelo de linguagem em hardware comum no local contrasta fortemente com a abordagem tradicional de usar uma infraestrutura massiva de data center para dar suporte a modelos avançados de IA.

Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

De acordo com informações do DeepSeek, testes iniciais mostraram melhorias significativas em relação às versões anteriores. Este modelo foi rigorosamente testado por partes interessadas internas e demonstrou excelente desempenho, superando até mesmo todos os outros modelos concorrentes e superando o Claude Sonnet 3.5 da Anthropic em tarefas que não exigem pensamento profundo. No entanto, diferentemente dos modelos estilo Sonnet que exigem uma assinatura paga, o DeepSeek-V3-0324 é totalmente gratuito para baixar e usar.

Tecnicamente, o DeepSeek-V3-0324 usa uma arquitetura mista de especialistas (MoE). Destaca-se pela capacidade de usar seletivamente cerca de 37 bilhões dos 685 bilhões de parâmetros por tarefa, aumentando a eficiência ao reduzir as demandas computacionais e mantendo o desempenho. Este modelo também aplica tecnologias de Atenção Latente Multicabeça (MLA) e Predição Multitoken (MTP), que contribuem para melhorar a memória de contexto e acelerar a saída.

Os usuários podem acessar o DeepSeek-V3-0324 via Hugging Face, interface de bate-papo e API do OpenRouter, bem como a plataforma de bate-papo do DeepSeek, se desejarem. O provedor de serviços de inferência Hyperbolic Labs também fornece acesso ao modelo.

Com o lançamento do DeepSeek-V3-0324, a empresa continua a afirmar sua posição na corrida para desenvolver grandes modelos de linguagem, ao mesmo tempo em que fornece uma opção poderosa e acessível para a comunidade de pesquisa e desenvolvimento de IA. A capacidade de rodar em hardware comum, aliada a uma licença gratuita, certamente abrirá muitas oportunidades de aplicação prática para este modelo em um futuro próximo.

Sign up and earn $1000 a day ⋙

Leave a Comment

Por que o ChatGPT é melhor que o DeepSeek

Por que o ChatGPT é melhor que o DeepSeek

Inicialmente, as pessoas tinham grandes esperanças no DeepSeek. Como um chatbot de IA comercializado como um forte concorrente do ChatGPT, ele promete recursos e experiências de bate-papo inteligentes.

Alibaba revela QwQ-32b, um concorrente digno do DeepSeek

Alibaba revela QwQ-32b, um concorrente digno do DeepSeek

Ainda não se sabe se as alegações do Alibaba se tornarão realidade, mas parece que o ChatGPT e o DeepSeek agora têm um novo concorrente digno.

Microsoft integra DeepSeek na plataforma PC Copilot+

Microsoft integra DeepSeek na plataforma PC Copilot+

Em janeiro, a Microsoft anunciou planos para trazer versões otimizadas para NPU do modelo DeepSeek-R1 diretamente para computadores Copilot+ com processadores Qualcomm Snapdragon X.

Como registrar rapidamente uma conta DeepSeek

Como registrar rapidamente uma conta DeepSeek

O aplicativo de IA DeepSeek, sediado na China, está atualmente liderando as paradas da loja de aplicativos.

Golpistas estão usando o Deepseek para roubar dados do usuário

Golpistas estão usando o Deepseek para roubar dados do usuário

Bandidos estão criando milhares de sites semelhantes ao DeepSeek na esperança de que usuários desavisados ​​forneçam suas informações pessoais.

Softbank planeja ultrapassar a Microsoft e se tornar o maior investidor da OpenAI

Softbank planeja ultrapassar a Microsoft e se tornar o maior investidor da OpenAI

A gigante japonesa de investimentos Softbank está planejando investir de US$ 15 a US$ 25 bilhões na OpenAI. Se o acordo for fechado, a Softbank se tornará a maior investidora da OpenAI, substituindo a Microsoft, que atualmente ocupa a posição.

Esses anúncios falsos do DeepSeek estão espalhando malware perigoso

Esses anúncios falsos do DeepSeek estão espalhando malware perigoso

Uma série de anúncios fraudulentos do DeepSeek no Google estão distribuindo malware perigoso que rouba informações para usuários desavisados ​​do DeepSeek.

DeepSeek convida usuários a explorar os bastidores da IA ​​de código aberto da empresa

DeepSeek convida usuários a explorar os bastidores da IA ​​de código aberto da empresa

A startup chinesa de inteligência artificial DeepSeek está planejando ser mais “transparente” sobre a tecnologia por trás de seus modelos de IA de código aberto, como o modelo de raciocínio R1.

Huawei lança o telefone dobrável Pura X com assistente de IA DeepSeek

Huawei lança o telefone dobrável Pura X com assistente de IA DeepSeek

A Huawei está embarcando em uma era completamente livre de Android com o Pura X, um novo telefone dobrável que executa o software HarmonyOS 5 da empresa e não inclui uma opção para as pessoas usarem o sistema operacional do Google.

4 motivos pelos quais você deve abandonar o ChatGPT e começar a usar o DeepSeek

4 motivos pelos quais você deve abandonar o ChatGPT e começar a usar o DeepSeek

DeepSeek é o nome de uma empresa chinesa de inteligência artificial e seu chatbot de mesmo nome. Os principais modelos da empresa, DeepSeek-V3 e DeepSeek-R1, fizeram sucesso porque são mais baratos de treinar e usar do que seus equivalentes.

Esqueça a RTX 5070, nem a RTX 5080 supera a RTX 4090

Esqueça a RTX 5070, nem a RTX 5080 supera a RTX 4090

A semana passada não foi feliz para os investidores ou fãs da Nvidia.

EUA consideram investigar contrabando de GPU Nvidia para a China para executar o DeepSeek

EUA consideram investigar contrabando de GPU Nvidia para a China para executar o DeepSeek

A DeepSeek, empresa chinesa por trás do modelo de IA gratuito que está agitando o mundo da tecnologia, está enfrentando uma série de alegações negativas, incluindo o uso de GPUs Nvidia contrabandeadas para treinar e executar seu modelo de IA homônimo.

Diferença entre TV comum e Smart TV

Diferença entre TV comum e Smart TV

As Smart TVs realmente conquistaram o mundo. Com tantos recursos excelentes e conectividade à Internet, a tecnologia mudou a maneira como assistimos TV.

Por que o freezer não tem luz, mas a geladeira tem?

Por que o freezer não tem luz, mas a geladeira tem?

Geladeiras são eletrodomésticos comuns em residências. As geladeiras geralmente têm 2 compartimentos, o compartimento frio é espaçoso e tem uma luz que acende automaticamente toda vez que o usuário o abre, enquanto o compartimento do freezer é estreito e não tem luz.

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

As redes Wi-Fi são afetadas por muitos fatores além de roteadores, largura de banda e interferência, mas existem algumas maneiras inteligentes de melhorar sua rede.

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Se você quiser voltar para o iOS 16 estável no seu telefone, aqui está o guia básico para desinstalar o iOS 17 e fazer o downgrade do iOS 17 para o 16.

O que acontece com o corpo quando você come iogurte todos os dias?

O que acontece com o corpo quando você come iogurte todos os dias?

Iogurte é um alimento maravilhoso. É bom comer iogurte todos os dias? Quando você come iogurte todos os dias, como seu corpo muda? Vamos descobrir juntos!

Que tipo de arroz é melhor para a saúde?

Que tipo de arroz é melhor para a saúde?

Este artigo discute os tipos de arroz mais nutritivos e como maximizar os benefícios para a saúde de qualquer arroz que você escolher.

Como acordar na hora certa pela manhã

Como acordar na hora certa pela manhã

Estabelecer um horário de sono e uma rotina para dormir, mudar o despertador e ajustar a dieta são algumas das medidas que podem ajudar você a dormir melhor e acordar na hora certa pela manhã.

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Alugue, por favor! Landlord Sim é um jogo de simulação para dispositivos móveis para iOS e Android. Você jogará como proprietário de um complexo de apartamentos e começará a alugar um apartamento com o objetivo de reformar o interior do seu apartamento e deixá-lo pronto para inquilinos.

Últimos códigos de defesa de torre de banheiro e como inseri-los

Últimos códigos de defesa de torre de banheiro e como inseri-los

Obtenha o código do jogo Bathroom Tower Defense Roblox e resgate recompensas emocionantes. Elas ajudarão você a melhorar ou desbloquear torres com maior dano.

Estrutura, símbolos e princípios de funcionamento dos transformadores

Estrutura, símbolos e princípios de funcionamento dos transformadores

Vamos aprender sobre a estrutura, os símbolos e os princípios de operação dos transformadores da maneira mais precisa.

4 maneiras pelas quais a IA está melhorando as Smart TVs

4 maneiras pelas quais a IA está melhorando as Smart TVs

De melhor qualidade de imagem e som a controle de voz e muito mais, esses recursos com tecnologia de IA estão tornando as smart TVs muito melhores!

Por que o ChatGPT é melhor que o DeepSeek

Por que o ChatGPT é melhor que o DeepSeek

Inicialmente, as pessoas tinham grandes esperanças no DeepSeek. Como um chatbot de IA comercializado como um forte concorrente do ChatGPT, ele promete recursos e experiências de bate-papo inteligentes.

Conheça Fireflies.ai: a secretária de IA gratuita que economiza horas de trabalho

Conheça Fireflies.ai: a secretária de IA gratuita que economiza horas de trabalho

É fácil perder detalhes importantes ao anotar outros itens essenciais, e tentar fazer anotações enquanto conversa pode ser uma distração. Fireflies.ai é a solução.

Como criar Axolotl no Minecraft, domar Salamandra no Minecraft

Como criar Axolotl no Minecraft, domar Salamandra no Minecraft

O Axolot do Minecraft será um ótimo assistente para jogadores que operam debaixo d'água se eles souberem como usá-lo.

Configuração do jogo para PC A Quiet Place: The Road Ahead

Configuração do jogo para PC A Quiet Place: The Road Ahead

A configuração de A Quiet Place: The Road Ahead é bem avaliada, então você precisa considerar a configuração antes de decidir fazer o download.