A história da tecnologia empresarial muitas vezes pode ser entendida como uma oscilação entre centralização e descentralização, à medida que a indústria alterna entre posições aparentemente opostas.

Inovação centralizada

A centralização favorece o desenvolvimento precoce de tecnologias inovadoras. Recursos grandes, muitas vezes bem financiados, estão concentrados em um ou poucos lugares, com equipes concorrentes trabalhando em uma questão semelhante.

Esse foco intenso leva a uma explosão de inovação e a uma evolução inicial acelerada. Produtos e serviços seguem rapidamente, e muitas variações da tecnologia moderna “nascem” coletivamente em rápida sucessão.

Aplicativo descentralizado

Nesse ponto, a tecnologia deve ir para o mercado e o processo de descentralização começa. As aplicações do mundo real diferem entre verticais e geografias, e vários ciclos de feedback começam a refinar os produtos e serviços rapidamente. Essas otimizações alimentam a vantagem do pioneirismo e o retorno sobre o investimento (ROI) começa a disparar.

Isso, por sua vez, atrai investimentos que estendem a descentralização à medida que a tecnologia se expande para setores e geografias mais diversos.

Digite IA

Essa oscilação agora está sendo vista com a IA – especificamente a evolução da IA.

É importante reconhecer o incrível ritmo dessa evolução. Embora a IA faça parte da tecnologia corporativa há anos, faz apenas vinte meses desde que o ChatGPT colocou a IA na consciência pública e a colocou no topo da agenda de todos os CIOs.

Mas já estamos vendo uma mudança de uma abordagem centralizada para uma abordagem mais distribuída da IA. Isso se deve à evolução da IA generativa e dos grandes modelos de linguagem (LLMs) que treinam a IA generativa, para o domínio da IA de inferência.

Enquanto a 'inteligência artificial generativa' se refere ao uso de IA para criar novos conteúdos, como texto, imagens, música, áudio e vídeos, a IA de inferência refere-se ao uso de modelos para produzir previsões e conclusões, com base em dados existentes. É a diferença entre moldar hoje e ver amanhã.

Esse intenso interesse na IA de inferência é impulsionado por empresas que aprenderam as lições dos investimentos em tecnologia no passado. Elas estão preocupados em como podem realmente usar a IA no curso de seus negócios – e quais são os benefícios. Não surpreendentemente, ver o futuro está no topo dessa lista.

Por que as diferentes arquiteturas de IA são importantes

A IA generativa favorece recursos centralizados e em hiperescala de processamento de dados e computação. Já houve uma ampla exploração do aumento da demanda por energia e capacidade de Data Center que a IA generativa criou – e o desenvolvimento da IA generativa tem todas as características da inovação concentrada e centralizada.

Mas a IA de inferência favorece uma abordagem mais descentralizada. Para fornecer insights e previsões precisos, a IA precisa estar o mais próximo possível da fonte de dados, para que possa fornecer análises em tempo real. Isso é especialmente verdadeiro se essas fontes de dados forem particularmente ricas, como no caso de imagens de vídeo.

A velocidade rápida exige baixa latência, o que exige colocar a inferência de que a IA precisa perto da fonte de dados. Portanto, favorece uma arquitetura regional de ponta.

Nessa corrida, os nanossegundos são importantes. Considere uma IA de inferência sugerindo ou fazendo negociações automaticamente em uma bolsa de moeda estrangeira ou ações e ações. Se os dados necessários para alimentar a IA tiverem que atravessar o mundo, haverá um atraso inevitável (sem mencionar um custo substancial). Em comparação, se a IA estiver no mesmo país ou região, esse tempo e custo entrarão em colapso. E uma IA local pode agir mais rápido do que uma global, vencendo-a efetivamente.

Consumindo IA diferente

À medida que a IA generativa e a inferência começam a coexistir, a questão crítica será como esses diferentes recursos são oferecidos às empresas.

Embora as empresas possam ter força para criar sua própria evolução de IA em camadas, as organizações de pequeno e médio porte não podem se dar ao luxo de desenvolver sua própria infraestrutura para gerenciar seus requisitos generativos e de inferência. E nenhuma organização quer uma variedade de faturas de diferentes fornecedores de IA.

Em vez disso, a expectativa dessas empresas é que a IA faça parte das atualizações e do desenvolvimento contínuos do software que já usam. Isso já foi visto na adição de IA ao Excel e no claro foco da IA em atualizações do Google Workspace e do Salesforce Einstein.

Mas para as empresas que fornecem esse software e funcionalidade de IA, elas precisam de parceiros de infraestrutura digital. Esses parceiros devem oferecer não apenas o trânsito rápido e seguro de grandes quantidades de dados para recursos de processamento centralizado (ou mesmo para a nuvem), mas também recursos regionais dedicados. Isso requer um portfólio de instalações em todo o país, conectadas umas às outras e, em seguida, à Internet e nuvens além.

A evolução da IA já mostrou que ela seguirá o caminho da inovação centralizada para o uso distribuído; o dinheiro realmente inteligente agora está em garantir que – independentemente de generativo e inferência – as empresas estejam atentas aos casos e aplicativos de IA de uso que podem oferecer vantagem competitiva mais rapidamente.

Mais sobre a Pulsant