Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

A startup chinesa de IA DeepSeek acaba de lançar oficialmente seu mais recente modelo de grande linguagem (LLM), DeepSeek-V3-0324. Com capacidade de até 641 GB, este modelo foi anunciado na plataforma AI Hugging Face sem que muitas informações fossem reveladas, seguindo o estilo sigiloso sobre novos produtos que a empresa sempre aplicou até então.

O diferencial desse modelo é a licença MIT, que permite o uso gratuito para fins comerciais. Os resultados iniciais do benchmark mostram que o DeepSeek-V3-0324 é capaz de rodar em configurações de hardware convencionais, como o Mac Studio da Apple com o chip M3 Ultra. O cientista de IA Awni Hannun relatou que era possível atingir velocidades de processamento de mais de 20 tokens por segundo usando essa configuração. Essa capacidade de executar um grande modelo de linguagem em hardware comum no local contrasta fortemente com a abordagem tradicional de usar uma infraestrutura massiva de data center para dar suporte a modelos avançados de IA.

Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

De acordo com informações do DeepSeek, testes iniciais mostraram melhorias significativas em relação às versões anteriores. Este modelo foi rigorosamente testado por partes interessadas internas e demonstrou excelente desempenho, superando até mesmo todos os outros modelos concorrentes e superando o Claude Sonnet 3.5 da Anthropic em tarefas que não exigem pensamento profundo. No entanto, diferentemente dos modelos estilo Sonnet que exigem uma assinatura paga, o DeepSeek-V3-0324 é totalmente gratuito para baixar e usar.

Tecnicamente, o DeepSeek-V3-0324 usa uma arquitetura mista de especialistas (MoE). Destaca-se pela capacidade de usar seletivamente cerca de 37 bilhões dos 685 bilhões de parâmetros por tarefa, aumentando a eficiência ao reduzir as demandas computacionais e mantendo o desempenho. Este modelo também aplica tecnologias de Atenção Latente Multicabeça (MLA) e Predição Multitoken (MTP), que contribuem para melhorar a memória de contexto e acelerar a saída.

Os usuários podem acessar o DeepSeek-V3-0324 via Hugging Face, interface de bate-papo e API do OpenRouter, bem como a plataforma de bate-papo do DeepSeek, se desejarem. O provedor de serviços de inferência Hyperbolic Labs também fornece acesso ao modelo.

Com o lançamento do DeepSeek-V3-0324, a empresa continua a afirmar sua posição na corrida para desenvolver grandes modelos de linguagem, ao mesmo tempo em que fornece uma opção poderosa e acessível para a comunidade de pesquisa e desenvolvimento de IA. A capacidade de rodar em hardware comum, aliada a uma licença gratuita, certamente abrirá muitas oportunidades de aplicação prática para este modelo em um futuro próximo.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft integra DeepSeek na plataforma PC Copilot+

Microsoft integra DeepSeek na plataforma PC Copilot+

Em janeiro, a Microsoft anunciou planos para trazer versões otimizadas para NPU do modelo DeepSeek-R1 diretamente para computadores Copilot+ com processadores Qualcomm Snapdragon X.

Como registrar rapidamente uma conta DeepSeek

Como registrar rapidamente uma conta DeepSeek

O aplicativo de IA DeepSeek, sediado na China, está atualmente liderando as paradas da loja de aplicativos.

Golpistas estão usando o Deepseek para roubar dados do usuário

Golpistas estão usando o Deepseek para roubar dados do usuário

Bandidos estão criando milhares de sites semelhantes ao DeepSeek na esperança de que usuários desavisados ​​forneçam suas informações pessoais.

Softbank planeja ultrapassar a Microsoft e se tornar o maior investidor da OpenAI

Softbank planeja ultrapassar a Microsoft e se tornar o maior investidor da OpenAI

A gigante japonesa de investimentos Softbank está planejando investir de US$ 15 a US$ 25 bilhões na OpenAI. Se o acordo for fechado, a Softbank se tornará a maior investidora da OpenAI, substituindo a Microsoft, que atualmente ocupa a posição.

Esses anúncios falsos do DeepSeek estão espalhando malware perigoso

Esses anúncios falsos do DeepSeek estão espalhando malware perigoso

Uma série de anúncios fraudulentos do DeepSeek no Google estão distribuindo malware perigoso que rouba informações para usuários desavisados ​​do DeepSeek.

DeepSeek convida usuários a explorar os bastidores da IA ​​de código aberto da empresa

DeepSeek convida usuários a explorar os bastidores da IA ​​de código aberto da empresa

A startup chinesa de inteligência artificial DeepSeek está planejando ser mais “transparente” sobre a tecnologia por trás de seus modelos de IA de código aberto, como o modelo de raciocínio R1.

Huawei lança o telefone dobrável Pura X com assistente de IA DeepSeek

Huawei lança o telefone dobrável Pura X com assistente de IA DeepSeek

A Huawei está embarcando em uma era completamente livre de Android com o Pura X, um novo telefone dobrável que executa o software HarmonyOS 5 da empresa e não inclui uma opção para as pessoas usarem o sistema operacional do Google.

4 motivos pelos quais você deve abandonar o ChatGPT e começar a usar o DeepSeek

4 motivos pelos quais você deve abandonar o ChatGPT e começar a usar o DeepSeek

DeepSeek é o nome de uma empresa chinesa de inteligência artificial e seu chatbot de mesmo nome. Os principais modelos da empresa, DeepSeek-V3 e DeepSeek-R1, fizeram sucesso porque são mais baratos de treinar e usar do que seus equivalentes.

Esqueça a RTX 5070, nem a RTX 5080 supera a RTX 4090

Esqueça a RTX 5070, nem a RTX 5080 supera a RTX 4090

A semana passada não foi feliz para os investidores ou fãs da Nvidia.

EUA consideram investigar contrabando de GPU Nvidia para a China para executar o DeepSeek

EUA consideram investigar contrabando de GPU Nvidia para a China para executar o DeepSeek

A DeepSeek, empresa chinesa por trás do modelo de IA gratuito que está agitando o mundo da tecnologia, está enfrentando uma série de alegações negativas, incluindo o uso de GPUs Nvidia contrabandeadas para treinar e executar seu modelo de IA homônimo.

Monitores externos podem ter um impacto negativo nas baterias do laptop.

Monitores externos podem ter um impacto negativo nas baterias do laptop.

Usar um laptop com um monitor externo é uma ótima combinação para aumentar a produtividade e ajudar você a realizar seu trabalho. Mas com o tempo, você perceberá que a bateria do seu laptop vai acabar rapidamente e a vida útil da bateria começará a diminuir.

8 grandes desvantagens dos celulares com tela dobrável que você não esperava

8 grandes desvantagens dos celulares com tela dobrável que você não esperava

Não há como negar que os telefones dobráveis ​​são muito legais. Mas depois de um tempo de uso, esse dispositivo apresenta algumas peculiaridades. Aqui estão 5 grandes desvantagens dos celulares com tela dobrável que você não esperaria!

A Adobe está trazendo a tecnologia de criação de vídeos com IA para o Premiere Pro

A Adobe está trazendo a tecnologia de criação de vídeos com IA para o Premiere Pro

A Adobe levou a tecnologia de criação de vídeos com IA para as massas de uma nova maneira, embora ainda não tenha criado um filme finalizado usando a tecnologia.

Últimos códigos do Genshin Impact de abril de 2025

Últimos códigos do Genshin Impact de abril de 2025

O código Genshin Impact 5.5 ajuda você a trocar por Pedras Primordiais, Minerais Mágicos, experiência e muitas outras recompensas.

Como transformar seu iPad em uma tela extra para Mac

Como transformar seu iPad em uma tela extra para Mac

O macOS Catalina e o iPadOS incluem suporte para um novo recurso chamado Sidecar, projetado para permitir que você use seu iPad como uma tela secundária para seu Mac.

Papel de parede 1280, lindo papel de parede para celular Nokia 1280

Papel de parede 1280, lindo papel de parede para celular Nokia 1280

Este é um conjunto de papéis de parede do Nokia 1280. Se você já enviou uma mensagem de texto para obter papéis de parede do 1280, papéis de parede de celular em formato de tijolo, experimente olhar esses papéis de parede.

Avião espacial hipersônico atinge velocidade de 11.115 km/h

Avião espacial hipersônico atinge velocidade de 11.115 km/h

A Venus Aerospace revelou as primeiras imagens de sua nova aeronave hipersônica chamada Stargazer, que pode atingir uma velocidade máxima de 11.115 km/h, equivalente a Mach 9.

Comer bananas no café da manhã ajuda a reduzir o inchaço

Comer bananas no café da manhã ajuda a reduzir o inchaço

Inchaço pode acontecer com qualquer pessoa. A boa notícia é que o café da manhã é um ótimo momento para adicionar alguns ingredientes à sua refeição que ajudarão a reduzir o inchaço. Esse ingrediente é banana.

OpenAI anuncia grande atualização na geração de imagens de IA no ChatGPT

OpenAI anuncia grande atualização na geração de imagens de IA no ChatGPT

A OpenAI acaba de introduzir oficialmente uma atualização notável na capacidade de geraç��o de imagens de IA no ChatGPT, um importante passo à frente em vez de usar um modelo de geração de imagens separado como o DALL-E anterior.

Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

Deepseek lança modelo de linguagem gratuito v3 que funciona bem em configurações comuns de hardware

A startup chinesa de IA DeepSeek acaba de lançar oficialmente seu mais recente modelo de grande linguagem (LLM), DeepSeek-V3-0324.

Motivos para abandonar o Gboard e migrar para o teclado Samsung

Motivos para abandonar o Gboard e migrar para o teclado Samsung

O Gboard é há muito tempo o teclado preferido em telefones Android. No entanto, muitas pessoas mudaram recentemente para o teclado Samsung e não olharam para trás.

Desejos doces e românticos de fim de semana para os amantes

Desejos doces e românticos de fim de semana para os amantes

Envie desejos doces e românticos de fim de semana para seu amor. Embora sejam apenas palavras ou mensagens, elas serão presentes espirituais significativos, ajudando a fortalecer seu relacionamento.

A série de TV Harry Potter precisa dos seguintes elementos para ter sucesso

A série de TV Harry Potter precisa dos seguintes elementos para ter sucesso

O remake de Harry Potter da HBO tem estreia prevista para 2026. Veja o que torna a série Harry Potter na TV um sucesso.

Imagens impressionantes da superlua ao redor do mundo

Imagens impressionantes da superlua ao redor do mundo

Belas fotos da lua não são raras na Internet. O artigo resumirá para você as mais belas fotos da lua do mundo.

Usuários do AMD Ryzen devem instalar esta atualização do BIOS para um aumento de desempenho gratuito

Usuários do AMD Ryzen devem instalar esta atualização do BIOS para um aumento de desempenho gratuito

Agora, a AMD respondeu aos problemas com sua linha de CPUs principais de baixo desempenho com uma nova atualização que pode fornecer mais alguns quadros por segundo.