A IBM desenvolveu com sucesso uma nova tecnologia óptica que pode dar suporte ao treinamento de modelos de IA na “velocidade da luz”, economizando energia significativamente. A IBM afirma que, ao aplicar esses novos avanços aos data centers, a energia economizada no treinamento de um modelo típico de IA é equivalente ao uso anual de energia de 5.000 residências nos EUA.
Enquanto os data centers se conectam ao mundo externo usando cabos de fibra óptica, internamente, a fiação de cobre ainda é o material predominantemente usado, de acordo com a IBM. Esses fios de cobre que conectam os aceleradores de GPU passam muito tempo esperando por dados de outros dispositivos enquanto consomem energia, o que aumenta significativamente os custos operacionais. Comentando sobre a nova tecnologia de transmissão óptica de dados, Dario Gil, vice-presidente sênior e diretor de pesquisa da IBM, disse:
À medida que a IA cria uma necessidade de mais potência e poder de processamento, os data centers precisam evoluir — e a tecnologia genérica de óptica empacotada pode ajudar os data centers de grande porte a se adaptarem melhor às demandas futuras. Com esse avanço, os processadores do futuro se comunicarão da mesma forma que os cabos de fibra óptica transportam dados para dentro e para fora dos data centers, inaugurando uma nova era de comunicações mais rápidas e sustentáveis, capazes de lidar com enormes cargas de trabalho de IA.

A IBM descreve seu novo protótipo de tecnologia de óptica de co-pacote (CPO) em um artigo técnico . Essencialmente, ao aumentar significativamente a largura de banda nos data centers, o tempo de inatividade da GPU pode ser minimizado, acelerando o processamento de IA.
A IBM promete com confiança que essa tecnologia pode ajudar a reduzir o tempo de treinamento de grandes modelos de linguagem (LLMs) de três meses para três semanas. Ao mesmo tempo, o aumento da eficiência energética reduzirá o consumo de energia e os custos associados ao treinamento de LLM.