A Oracle desenvolveu seu próprio sistema para identificar a origem das interrupções de Data Centers quase em tempo real usando aprendizado de máquina.

A empresa recebeu uma patente para um “serviço de detecção de interrupção”, que diz poder lidar com “dados quase em tempo real de várias fontes em um Data Center e processar os dados usando um modelo para determinar uma ou mais fontes projetadas de uma interrupção detectada”.

De acordo com o pedido de patente, o sistema conta com modelos de aprendizado de máquina que incorporam uma série de regras para interpretar esses dados e é capaz de gerar mensagens de alerta detalhando a fonte suspeita de uma interrupção.

A empresa diz que esse sistema é necessário porque “à medida que mais dispositivos e aplicativos são implementados no Data Center, identificar com eficiência a origem de uma interrupção pode se tornar cada vez mais difícil”.

A solução da Oracle aparentemente é capaz de coletar informações de várias fontes, incluindo servidores e hardware de rede, bem como dispositivos de energia e sensores ambientais em um Data Center.

O pedido de patente usa o exemplo de interrupção causada pela falha de uma fonte de energia do rack para demonstrar como o sistema funciona. No exemplo, o modelo pode “identificar um nível de energia da fonte de energia do rack como caindo abaixo de um nível limite” e enviar um alerta especificando que essa é a fonte provável da interrupção. Isso pode ajudar os Data Centers da empresa a se recuperarem de uma falha com mais eficiência.

Os inventores do sistema são Alex Hamilton, diretor de desenvolvimento de software da Oracle, Amar Monga, seu gerente sênior de engenharia de software e Bin Chen, engenheiro de software da empresa com sede em Seattle. A DCD entrou em contato com a Oracle para obter mais detalhes sobre o sistema.

Os Data Centers se tornaram um grande negócio para a Oracle, com a empresa lucrando com o boom da IA alugando sua infraestrutura digital para alguns dos maiores players do mercado.

Embora um acordo de 10 bilhões de dólares (56,5 bilhões de reais) para fornecer capacidade de GPU para o xAI de Elon Musk tenha fracassado, ele tem um acordo em andamento com a Microsoft, que usa as GPUs da Oracle para as funções de IA de seu mecanismo de busca Bing.

O fundador da Oracle, Larry Ellison, disse no ano passado que a plataforma Oracle Cloud Infrastructure (OCI) da empresa estava sendo instalada em 20 Data Centers da Microsoft. Ellison havia declarado anteriormente que a Oracle planeja construir 100 Data Centers adicionais para lidar com a demanda de nuvem por IA, embora a empresa normalmente alugue espaço em vez de realmente construir instalações próprias.

Falando em uma teleconferência de resultados em março, Ellison afirmou que sua empresa estava “construindo alguns dos maiores Data Centers do mundo”.

Usando como referência um site que a Oracle está desenvolvendo no estado americano de Utah, ele disse: “Estamos construindo um Data Center de IA nos Estados Unidos, em que você pode estacionar oito Boeing 747 lado a lado nesse Data Center. Então, estamos construindo um grande número de Data Centers, e alguns desses Data Centers são pequenos, mas alguns desses Data Centers são os maiores Data Centers de IA do mundo”.

“Estamos trazendo enormes quantidades de capacidade nos próximos 24 meses porque a demanda é muito alta [e] precisamos fazer isso apenas para satisfazer nosso conjunto existente de clientes”.