“Entra lixo, sai lixo” é uma afirmação que se aplica particularmente ao campo explosivo da inteligência artificial (IA). À medida que as organizações integram a IA para impulsionar a inovação, apoiar os processos de negócios e aprimorar a tomada de decisões, é crucial considerar que a confiabilidade da IA é influenciada pela qualidade da alimentação e treinamento de dados do modelo.

As organizações perceberam essa relação entre dados de alta qualidade e IA eficaz, levando muitas a reconsiderar as abordagens de governança e análise de dados. De acordo com uma pesquisa do Gartner com 479 executivos seniores em funções de dados e análises, 61% das organizações estão reavaliando suas estruturas de dados e análises (D&A) em resposta a tecnologias disruptivas de IA.

Além disso, 38% desses líderes esperam uma revisão completa das arquiteturas de D&A nos próximos 12 a 18 meses para permanecerem relevantes e eficazes no cenário em evolução.

A qualidade dos dados é crucial em qualquer jornada de implementação de IA, principalmente quando insights acionáveis são o resultado desejado. Dados de alta qualidade são precisos, completos e bem estruturados; originam-se de fontes confiáveis; e são constantemente atualizados para se manter relevantes. Em ambientes em rápida mudança, a falta de qualidade e consistência pode resultar em resultados ruins de IA, levando a uma tomada de decisão comprometida.

A qualidade inicial dos dados durante o treinamento do modelo é especialmente importante, afetando a capacidade do modelo de identificar padrões e produzir recomendações relevantes e explicáveis. Ao selecionar e padronizar cuidadosamente as fontes de dados, as organizações podem aprimorar seus casos de uso de IA.

Por exemplo, quando a IA é usada para monitorar o desempenho da infraestrutura de TI e melhorar o help desk de TI (por sua vez, melhorando a experiência digital do funcionário), alimentar o modelo com dados específicos, como uso da CPU, tempo de atividade, tráfego de rede e latência, garante saídas mais precisas e explicáveis da IA. A equipe de TI pode obter insights relevantes e orientados por dados sobre possíveis falhas de endpoint.

Empregando Machine Learning (ML), um subconjunto de IA que cria modelos preditivos para aprender com os dados, esse cenário de manutenção permite que as equipes de suporte técnico obtenham insights antecipados das detecções de anomalias do ML. Essa abordagem proativa e preditiva ajuda a reduzir o tempo de inatividade, aumentar a eficiência operacional e apoiar a produtividade dos funcionários.

Nem todas as organizações, no entanto, têm acesso a dados confiáveis para criar modelos de IA precisos e responsáveis. Para resolver esse problema e criar confiança nas iniciativas de dados e IA, as organizações devem priorizar atualizações regulares de dados.

Dados de alta qualidade devem estar livres de erros, provenientes de fontes confiáveis e ser validados quanto à precisão, pois dados incompletos e métodos de entrada inconsistentes podem levar a recomendações duvidosas de IA. Além disso, as repercussões da baixa qualidade dos dados se estendem a outros desafios associados às implementações de IA, como aumento dos custos operacionais e desafios na medição do ROI e do impacto nos negócios.

De forma alarmante, a IA processa todos os dados que recebe sem avaliar sua qualidade. Portanto, práticas avançadas de estruturação de dados e supervisão humana rigorosa, muitas vezes chamadas de “humano no circuito”, são essenciais para garantir que apenas os dados da mais alta qualidade sejam usados. Essa supervisão humana torna-se particularmente crucial em cenários de gerenciamento proativo de TI. Embora o ML, apoiado por uma extensa coleta de dados, possa aprimorar a detecção de anomalias e os recursos preditivos, é a entrada humana que garante que os insights sejam explicáveis e pertinentes.

A maioria dos fornecedores de TI corporativos agora está incorporando algum nível de IA em suas soluções, mas a qualidade e a diversidade dos dados usados podem variar significativamente. A IA superior resulta não apenas da coleta de dados com mais frequência de vários endpoints, mas também de como esses dados são estruturados.

Uma IA projetada especificamente para operações de TI ilustra a importância da qualidade dos dados. Ao analisar e categorizar os dados de desempenho coletados a cada 15 segundos de mais de 10.000 endpoints usando mais de 1.000 sensores, o ML pode detectar anomalias com proficiência. Ele pode prever possíveis interrupções futuras ou problemas de TI de forma proativa, ao mesmo tempo em que aumenta a produtividade e a satisfação dos funcionários.

Ao integrar esse vasto conjunto de dados ao ML, as equipes de TI também podem lidar com consultas em grande escala usando linguagem natural com eficiência. Os exemplos incluem a análise do uso médio do Microsoft Outlook ou a identificação de funcionários que estão subutilizando licenças de software caras que foram implementadas em toda a organização sem avaliar as necessidades individuais. Em última análise, a IA serve como um copiloto confiável para equipes de tecnologia, desde executivos de nível C e agentes de suporte de TI até engenheiros de sistemas.

Os compradores de TI devem priorizar o software orientado por IA que não apenas coleta dados de diversas fontes, mas também os integra de forma consistente, garantindo forte manuseio de dados e integridade estrutural. A profundidade, amplitude, histórico e qualidade dos dados são fatores cruciais ao selecionar um fornecedor.

À medida que a IA progride, seu sucesso virá de ter uma base sólida de dados de alta qualidade, para que as empresas que coletam e gerenciem seus dados com competência garantam que o uso da IA possa melhorar a tomada de decisões, aumentar a eficiência operacional e estimular a inovação.

Por outro lado, negligenciar a qualidade dos dados pode prejudicar criticamente a integridade dos projetos de IA. Olhando para o futuro, as organizações devem coletar e organizar meticulosamente seus extensos conjuntos de dados para realizar plenamente o potencial das implementações de IA.