A DeepSeek, empresa chinesa por trás do modelo de IA gratuito que abalou o mundo da tecnologia, está enfrentando uma série de alegações negativas, incluindo o uso de GPUs Nvidia contrabandeadas para treinar e executar seu modelo de IA homônimo.
Dessa forma, o Departamento de Comércio dos EUA está considerando investigar se a DeepSeek acessou e coletou ilegalmente GPUs da Nvidia por meio de intermediários em Cingapura. Nos últimos anos, os Estados Unidos mantiveram restrições rígidas à exportação de chips avançados para a China, com o objetivo de manter sua posição de liderança em tecnologia e conter o rápido desenvolvimento de seu rival.
A DeepSeek recentemente foi manchete por lançar seu modelo de inferência R1. Dizem que esse modelo tem desempenho próximo ao modelo o1 da OpenAI, que está disponível apenas no plano de assinatura ChatGPT Pro, que requer uma assinatura paga. O que torna o DeepSeek tão valioso é que ele não só tem desempenho semelhante, mas também é lançado como código aberto e gratuito para todos. Aqueles que nunca tiveram a oportunidade de experimentar o modelo de inferência de ponta da OpenAI agora têm o DeepSeek R1 como uma alternativa válida.
O DeepSeek foi tão popular que o aplicativo chegou ao primeiro lugar nas paradas da App Store dos EUA, fazendo com que o mercado de ações do país despencasse, com US$ 2 trilhões em capitalização de mercado eliminados em apenas alguns dias.
Notavelmente, a DeepSeek afirma ter feito tudo isso com apenas 2.000 GPUs Nvidia H800 e um custo estimado de investimento de US$ 6 milhões, um número pequeno comparado aos enormes investimentos feitos no OpenAI e em muitos outros modelos de IA semelhantes.
De acordo com o Citigroup, gigantes da tecnologia dos EUA como Microsoft, Meta, Amazon e Alphabet gastaram um total de cerca de US$ 209 bilhões em infraestrutura de dados no ano passado, dos quais 80% foram para data centers. Isso deixou muitos se perguntando se a DeepSeek está realmente fazendo algo diferente da OpenAI e outras empresas de IA dos EUA, e se é realmente possível treinar modelos de IA com tão menos recursos.

David Sacks, ex-funcionário de inteligência artificial do presidente Donald Trump, disse em uma entrevista recente que há "evidências substanciais" de que a DeepSeek destilou a saída da OpenAI para treinar seu próprio modelo. Esse processo de destilação envolve um “modelo filho” (DeepSeek) que imita o raciocínio do “modelo pai” (OpenAI), semelhante à forma como os humanos aprendem, fazendo milhões de perguntas. A Microsoft e a OpenAI também iniciaram suas próprias investigações sobre o assunto, principalmente para esclarecer se a DeepSeek acessou os dados da OpenAI de forma inapropriada.
A DeepSeek disse que usa o chip H800 — um chipset de IA que a Nvidia desenvolveu especificamente para o mercado chinês depois que os controles de exportação foram impostos pela primeira vez. Não está claro como a DeepSeek adquiriu as Nvidia H800s, mas a empresa pode comprá-las no final de 2022 ou 2023.
Atualmente, não há evidências de que a DeepSeek tenha usado chips contrabandeados. Mas diz-se que muitas empresas chinesas de IA fizeram o mesmo. O contrabando organizado de chips de IA para a China foi rastreado em vários países, incluindo Malásia, Cingapura e Emirados Árabes Unidos.