Por Holland Barry, vicepresidente sénior y CTO de Cyxtera


Las aplicaciones impulsadas por IA se están convirtiendo rápidamente en esenciales para las funciones comerciales clave, como el control de calidad y las comunicaciones con los clientes. Y la llegada de algoritmos de IA generativa como ChatGPT indica que solo estamos comenzando a ver qué tan omnipresente será esta tecnología en nuestra vida diaria.

Vicki Hamilton_Pixabay_technology_1200x800.png
– Vicki Hamilton, Pixabay

No es difícil comenzar con la IA. Los marcos accesibles y los modelos preentrenados proporcionan las bases sobre las que los desarrolladores pueden construir fácilmente. Muchos desarrolladores ejecutan sus experimentos de IA en su propio hardware o en la nube pública. Pero las cosas se complican más una vez que un proyecto pasa de las primeras etapas.

Desafíos ocultos de escalar la IA

A medida que los proyectos de inteligencia artificial y aprendizaje automático evolucionan y escalan con el tiempo, los requisitos de infraestructura para sus cargas de trabajo también cambian.

Los primeros experimentos pueden usar pequeños conjuntos de datos para crear un modelo de trabajo, pero a medida que crece una aplicación, debe acceder y procesar datos comerciales reales para cada caso de uso. Esto puede resultar problemático si los datos se almacenan en la nube pública, ya que las demandas de los procesos de desarrollo iterativo de la IA pueden ralentizar los recursos compartidos.

Los mayores requisitos informáticos de la inferencia en tiempo real pueden generar un rendimiento deficiente si una organización no se ejecuta en una infraestructura dedicada. A medida que un proyecto se amplía, es posible que sea necesario mantener el hardware informático y el almacenamiento de datos cerca uno del otro para mantener la latencia baja y el rendimiento alto.

Otro desafío es que una vez que una organización implementa con éxito la IA dentro de una función comercial clave, pasa de ser un experimento a ser una misión crítica, sin posibilidad de fallar. La infraestructura que la soporta debe ser rápida y completamente confiable, y la recuperación ante desastres se vuelve mucho más importante. Si se ejecuta en la nube pública, los requisitos de disponibilidad constante a menudo exigirán múltiples instancias en todas las regiones y proveedores de la nube.

La gobernanza y el cumplimiento también se vuelven cada vez más difíciles debido a la difusión de la TI en la sombra, donde los equipos de diferentes departamentos comienzan a desarrollar sus propias soluciones de IA, a menudo sin el conocimiento de TI. Los proyectos pueden terminar ejecutándose en múltiples proveedores de infraestructura, lo que podría causar problemas de seguridad y cumplimiento.

Encontrar la solución de infraestructura adecuada

Al considerar dónde alojar sus cargas de trabajo de IA para respaldar proyectos en crecimiento, hay cuatro opciones principales:

  • Nube pública: es flexible y escalable, el modelo de consumo "como servicio" facilita el inicio sin una gran inversión inicial y no tiene que preocuparse por el mantenimiento y la administración del hardware. Por otro lado, es posible que los recursos compartidos de la nube no puedan brindar el rendimiento requerido, lo que genera problemas con el acceso y la confiabilidad de las aplicaciones. Además, las tarifas por el almacenamiento, la descarga y el procesamiento de datos pueden acumularse rápidamente, y se pueden incurrir en costosas tarifas de salida de datos al implementar las mejores prácticas de recuperación ante desastres.
  • En las instalaciones: proporciona un control completo sobre sus datos. Es probable que el hardware dedicado cumpla con los requisitos de rendimiento y los costos tienden a ser más predecibles. Sin embargo, comenzar puede requerir un gasto de capital inicial significativo, y configurar un clúster de GPU lleva tiempo y requiere un conjunto de habilidades especializadas. Existen importantes requisitos de mantenimiento/gestión, y la planificación de la capacidad puede ser un gran desafío.
  • Colocación tradicional: Resuelve los desafíos de mantenimiento y administración de las instalaciones, al mismo tiempo que proporciona un control total sobre sus datos y equipos. Este modelo también proporciona más cómputo y almacenamiento a un costo menor que la nube pública. Por otro lado, el hardware dedicado puede requerir un gasto de capital significativo y, dependiendo de la disponibilidad, podría requerir meses de tiempo de entrega. Hacer cambios de infraestructura rápidamente también puede ser un desafío.
  • Infraestructura como servicio (IaaS) de AI/ML: esto puede proporcionar lo mejor de ambos mundos: la flexibilidad de la nube pública con el alto rendimiento necesario para las cargas de trabajo de IA. Existe un ecosistema creciente de proveedores de nube de IA que brindan a las empresas acceso inmediato a potencia informática de IA altamente escalable en un modelo de suscripción. Además, algunas empresas de centros de datos, como Cyxtera, ofrecen IaaS específicamente para cargas de trabajo de IA., lo que permite a las organizaciones aprovisionar hardware dedicado bajo demanda. Este enfoque se adapta bien a los proyectos de IA a medida que escalan, ya que ofrece una potencia de cómputo significativa sin grandes costos iniciales ni tiempos de espera. Puede aprovisionar rápidamente nuevos recursos a medida que aumentan sus requisitos de capacidad, lo que ayuda a reducir el costo total de propiedad y acelera el tiempo de comercialización, sin necesidad de preocuparse por el mantenimiento y la administración del hardware.

A medida que los proyectos de IA de su organización se vuelven más complejos y críticos para el negocio, ¿cuenta con la estrategia de infraestructura adecuada? De lo contrario, en algún momento tendrá problemas con el costo, el rendimiento o los recursos, cualquiera de los cuales podría hacer que un proyecto de IA fracase.

No es necesario estar "todo incluido" en ninguna solución de infraestructura. Al evaluar las opciones, las organizaciones deben:

  • Mirar los atributos de sus aplicaciones y datos de IA y tomarse el tiempo para comprender los requisitos tecnológicos específicos para cada carga de trabajo en su entorno;
  • Revisar los resultados comerciales deseados para cada carga de trabajo y mapearlos según los requisitos de infraestructura;
  • Crear una estrategia de infraestructura que le permita combinar los recursos correctos para cada carga de trabajo en cada etapa de su viaje de desarrollo de IA.