Cerebras lança a tecnologia de inferência de IA mais rápida do mundo, com desempenho 20 vezes maior que o da NVIDIA

A Cerebras Systems acaba de anunciar oficialmente o Cerebras Inference, considerado a solução de inferência de IA mais rápida do mundo. Esta inferência Cerebras oferece desempenho de até 1.800 tokens por segundo para modelos Llama 3.1 8B (8 bilhões de parâmetros) e 450 tokens por segundo para Llama 3.1 70B, o que é até quase 20 vezes mais rápido do que as soluções de inferência de IA baseadas em GPU NVIDIA disponíveis nas nuvens de hiperescala atuais em todo o mundo, incluindo o Microsoft Azure.

Além do seu desempenho incrível, o preço do serviço desta nova solução de inferência também é muito barato, uma fração do preço das populares plataformas de nuvem de GPU. Por exemplo, um cliente pode obter um milhão de tokens por apenas 10 centavos, proporcionando assim um desempenho de preço 100 vezes maior para cargas de trabalho de IA.

A precisão de 16 bits e a velocidade de inferência 20x mais rápida da Cerebras permitirão que os desenvolvedores criem aplicativos de IA de alto desempenho de última geração sem comprometer a velocidade ou o custo. Essa inovadora relação preço/desempenho é possível graças ao sistema Cerebras CS-3 e ao processador de IA Wafer Scale Engine 3 (WSE-3). O CS-3 oferece 7.000 vezes mais largura de banda de memória que o Nvidia H100, resolvendo o desafio técnico da largura de banda de memória para IA generativa.

Cerebras lança a tecnologia de inferência de IA mais rápida do mundo, com desempenho 20 vezes maior que o da NVIDIA

O Cerebras Inference está atualmente disponível nos três níveis a seguir:

  • O nível gratuito oferece acesso gratuito à API e limites de uso generosos para qualquer pessoa que se inscrever.
  • O nível de desenvolvedor foi projetado para implantações flexíveis e sem servidor, fornecendo aos usuários endpoints de API por uma fração do custo das alternativas existentes no mercado, com os modelos Llama 3.1 8B e 70B custando apenas 10 centavos e 60 centavos por milhão de tokens, respectivamente.
  • Os planos Enterprise Tier oferecem modelos ajustados, acordos de nível de serviço personalizados e suporte dedicado. Ideal para cargas de trabalho persistentes, as empresas podem acessar o Cerebras Inference por meio da nuvem privada gerenciada pela Cerebras ou no local.

Com desempenho recorde, preços competitivos e acesso à API aberta, o Cerebras Inference define um novo padrão para desenvolvimento e implantação de LLM aberto. Como a única solução capaz de fornecer treinamento e inferência de alta velocidade, a Cerebras abre possibilidades inteiramente novas para a IA.

Com as tendências de IA evoluindo rapidamente e a NVIDIA atualmente ocupando uma posição dominante no mercado, o surgimento de empresas como Cerebras e Groq sinaliza uma possível mudança na dinâmica de todo o setor. À medida que a demanda por soluções de inferência de IA mais rápidas e econômicas aumenta, soluções como a Cerebras Inference estão bem posicionadas para arriscar no domínio da NVIDIA, especialmente no espaço de inferência.

Sign up and earn $1000 a day ⋙

Leave a Comment

Diferença entre TV comum e Smart TV

Diferença entre TV comum e Smart TV

As Smart TVs realmente conquistaram o mundo. Com tantos recursos excelentes e conectividade à Internet, a tecnologia mudou a maneira como assistimos TV.

Por que o freezer não tem luz, mas a geladeira tem?

Por que o freezer não tem luz, mas a geladeira tem?

Geladeiras são eletrodomésticos comuns em residências. As geladeiras geralmente têm 2 compartimentos, o compartimento frio é espaçoso e tem uma luz que acende automaticamente toda vez que o usuário o abre, enquanto o compartimento do freezer é estreito e não tem luz.

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

2 maneiras de corrigir o congestionamento da rede que deixa o Wi-Fi lento

As redes Wi-Fi são afetadas por muitos fatores além de roteadores, largura de banda e interferência, mas existem algumas maneiras inteligentes de melhorar sua rede.

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Como fazer downgrade do iOS 17 para o iOS 16 sem perder dados usando o Tenorshare Reiboot

Se você quiser voltar para o iOS 16 estável no seu telefone, aqui está o guia básico para desinstalar o iOS 17 e fazer o downgrade do iOS 17 para o 16.

O que acontece com o corpo quando você come iogurte todos os dias?

O que acontece com o corpo quando você come iogurte todos os dias?

Iogurte é um alimento maravilhoso. É bom comer iogurte todos os dias? Quando você come iogurte todos os dias, como seu corpo muda? Vamos descobrir juntos!

Que tipo de arroz é melhor para a saúde?

Que tipo de arroz é melhor para a saúde?

Este artigo discute os tipos de arroz mais nutritivos e como maximizar os benefícios para a saúde de qualquer arroz que você escolher.

Como acordar na hora certa pela manhã

Como acordar na hora certa pela manhã

Estabelecer um horário de sono e uma rotina para dormir, mudar o despertador e ajustar a dieta são algumas das medidas que podem ajudar você a dormir melhor e acordar na hora certa pela manhã.

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Dicas para jogar Rent Please! Simulador de Proprietário para Iniciantes

Alugue, por favor! Landlord Sim é um jogo de simulação para dispositivos móveis para iOS e Android. Você jogará como proprietário de um complexo de apartamentos e começará a alugar um apartamento com o objetivo de reformar o interior do seu apartamento e deixá-lo pronto para inquilinos.

Últimos códigos de defesa de torre de banheiro e como inseri-los

Últimos códigos de defesa de torre de banheiro e como inseri-los

Obtenha o código do jogo Bathroom Tower Defense Roblox e resgate recompensas emocionantes. Elas ajudarão você a melhorar ou desbloquear torres com maior dano.

Estrutura, símbolos e princípios de funcionamento dos transformadores

Estrutura, símbolos e princípios de funcionamento dos transformadores

Vamos aprender sobre a estrutura, os símbolos e os princípios de operação dos transformadores da maneira mais precisa.

4 maneiras pelas quais a IA está melhorando as Smart TVs

4 maneiras pelas quais a IA está melhorando as Smart TVs

De melhor qualidade de imagem e som a controle de voz e muito mais, esses recursos com tecnologia de IA estão tornando as smart TVs muito melhores!

Por que o ChatGPT é melhor que o DeepSeek

Por que o ChatGPT é melhor que o DeepSeek

Inicialmente, as pessoas tinham grandes esperanças no DeepSeek. Como um chatbot de IA comercializado como um forte concorrente do ChatGPT, ele promete recursos e experiências de bate-papo inteligentes.

Conheça Fireflies.ai: a secretária de IA gratuita que economiza horas de trabalho

Conheça Fireflies.ai: a secretária de IA gratuita que economiza horas de trabalho

É fácil perder detalhes importantes ao anotar outros itens essenciais, e tentar fazer anotações enquanto conversa pode ser uma distração. Fireflies.ai é a solução.

Como criar Axolotl no Minecraft, domar Salamandra no Minecraft

Como criar Axolotl no Minecraft, domar Salamandra no Minecraft

O Axolot do Minecraft será um ótimo assistente para jogadores que operam debaixo d'água se eles souberem como usá-lo.

Configuração do jogo para PC A Quiet Place: The Road Ahead

Configuração do jogo para PC A Quiet Place: The Road Ahead

A configuração de A Quiet Place: The Road Ahead é bem avaliada, então você precisa considerar a configuração antes de decidir fazer o download.