Embora a óptica venha sendo usada em Data Centers há décadas, agora ela está chegando cada vez mais longe no coração pulsante do Data Center - os processadores e aceleradores que executam as cargas de trabalho do Data Center. Então, como chegamos aqui e como será o futuro?

A comunicação óptica tem a vantagem de alta largura de banda, baixa latência e baixa perda de energia. Embora tenha sido inicialmente usada para facilitar o tráfego de e para Data Centers, desde então tem sido usada dentro do próprio Data Center – normalmente no topo do rack (TOR) para criar links de alta velocidade entre switches top-of-rack nos racks. Os grandes fluxos de dados usados na IA, em que as interconexões de baixa latência e alta largura de banda são cruciais, apenas aceleraram o uso de comunicações ópticas.

Como exemplo da importância da óptica, o Google até desenvolveu seu próprio switch óptico, que faz uso de componentes ópticos de espaço livre para reduzir a latência e o consumo de energia de sua rede. Ao usar a óptica de espaço livre, o Google evitou a necessidade de converter sinais entre os domínios óptico e elétrico em cada switch.

O Google afirma que sua rede personalizada melhora a taxa de transferência em 30%, usa 40% menos energia, incorre em 30% menos CapEx, reduz a conclusão do fluxo em 10% e oferece 50 vezes menos tempo de inatividade em toda a rede. Isso significa que os nodos podem ser rapidamente ligados e desligados se ficarem inativos e precisarem ser reparados.

A ascensão das interconexões ópticas

Recentemente, tem havido uma tendência crescente de usar a interconexão óptica dentro do próprio rack. Impulsionada pelos requisitos de alta largura de banda e baixa latência da IA (já que os modelos de IA são distribuídos em dezenas de nodos de processamento), a interconexão óptica está ajudando esses sistemas de vários nodos a serem executados o mais rápido possível. Como sempre, a velocidade é fundamental.

A interconexão óptica é uma área de muita inovação. Existem startups desenvolvendo comutação de pacotes totalmente óptica - evitando a necessidade de converter sinais entre os domínios elétrico e óptico, economizando significativamente no consumo de energia e latência.

Outros estão aplicando óptica na próxima camada abaixo, em que o trabalho está em andamento para desenvolver interconexões chip a chip totalmente ópticas e mesmo de matriz de silício para matriz de silício. Aqui, a largura de banda de comunicação é ainda maior. Para que esse avanço ocorra, o pacote conjunto óptico é fundamental. Fundições e empresas de embalagens de chips estão investindo pesadamente nessa capacidade.

Da mudança ao processamento

A óptica não é apenas sobre comutação – ela também pode ser usada para processamento. Ele tem benefícios semelhantes de fornecer velocidade, potência e eficiência.

Por que usar óptica para processamento? A demanda de processamento de IA está aumentando a uma taxa fenomenal e o roteiro do silício não é capaz de acompanhar. Os desenvolvedores de chips de silício estão perseguindo retornos decrescentes; despejando cada vez mais tempo, esforço e dinheiro para alcançar ganhos marginais de desempenho.

A resposta atual na indústria é aumentar a área de silício, ter várias matrizes de silício dentro de um chip e usar embalagens sofisticadas para resolver os desafios que isso cria. Mas tem um custo enorme, tanto em dólares quanto na energia consumida.

O grande custo monetário é impulsionado pelo enorme gasto de capital para comprar os melhores e mais recentes aceleradores de IA, além do aumento da infraestrutura necessária para fornecer e resfriar esses dispositivos que consomem muita energia; isso antes de considerar o aumento do custo da energia consumida.

A óptica é ideal para IA, principalmente porque o coração da IA usa multiplicação de matriz vetorial, que é resolvida de forma muito eficiente na luz. Nos últimos anos, houve esperança de aplicar fotônica integrada para processamento de IA e, no entanto, a tecnologia agora está focada principalmente em aplicações de interconexão ou comutação, devido a limitações no uso de fotônica integrada para a enorme escala de processamento de matriz necessária para a IA moderna.

O uso de óptica 3D (espaço livre) para processamento supera esses desafios – ele usa uma fração da potência e oferece um salto no desempenho. O uso de óptica 3D significa que vetores muito amplos podem ser usados e isso maximiza o desempenho e a eficiência energética. Os aceleradores de IA que usam óptica 3D prometem oferecer soluções de baixo consumo de energia e alto desempenho por uma fração dos custos operacionais e de capital em comparação com as soluções de GPU atuais.

Com o uso cada vez maior de óptica no Data Center, a óptica 3D para processamento de IA será inevitavelmente o próximo passo.