"Pronto llegaremos a un punto de cruce donde habrá más poder de cómputo en Edge que en los centros de datos o en la nube", dijo a DCD Justin Boitano, director senior de Nvidia para empresas y Edge computing.
Su predicción es compartida por muchos en una industria que se prepara para un mundo donde proliferan los sensores, los sistemas de Internet de las Cosas pueblan nuestras ciudades y las reglas de Edge.
Pero sin una arquitectura informática única que domine este campo en crecimiento, este cambio significa que hay un gran mercado potencialmente en juego, y todos quieren un pedazo de él. Hay una lucha entre los principales diseñadores de chips, gigantes de la nube y nuevas empresas valientes, todos los cuales quieren construir los procesadores que ejecutarán Edge.
La carrera al Edge
Intel es uno de esos contendientes: con las CPU de la compañía dominando el centro de datos, espera traducir ese éxito al Edge.
Según El ingeniero principal de Intel, Ken Shoemaker,."Lo que hemos hecho con el procesador escalable Xeon de segunda generación es incorporar funciones que lo hacen ideal para el procesamiento en Edge, y este podría estar cerca de los dispositivos mismos o del borde de la red".
El ingeniero de redes senior Tim Verrall relacionó esto con la red telefónica, cuyos intercambios (a menudo denominados "oficinas centrales") son importantes en muchas propuestas de redes Edge. Sirven como puntos de convergencia para los sistemas telefónicos locales (el "bucle local") y las redes troncales de larga distancia de los proveedores de telecomunicaciones, y tienen una infraestructura de energía y refrigeración preexistente.
Los procesadores de próxima generación son "ideales para la oficina central de la próxima generación, que se encuentra en las primeras etapas de implementación", dijo Verrall. "Hay una gran cantidad de oficinas centrales y, por lo general, se encuentran a unas 15 kilómetros del punto final, ahí es donde se está implementando el Edge hoy".
Verrall continuó: “La cantidad de tráfico que 5G probablemente pondrá en la red obligará a que los servicios se ofrezcan en el límite y los proveedores de telecomunicaciones requerirán esta descarga de datos. De lo contrario, sus redes troncales se verán desbordadas”.
Pero un circuito local de hasta quince kilómetros puede colocar la oficina central demasiado lejos del Edge para algunas aplicaciones: los autos sin conductor, por ejemplo, no pueden permitirse ninguna latencia, y compañías como Renesas, NXP, Tesla e Intel están compitiendo para desarrollarse hardware que funcione en el propio vehículo.
Para otros dispositivos Edge conectados, como las cámaras de seguridad, invertir en hardware en el dispositivo que haga algunos preprocesos genera ahorros. "Si piensa en esa cámara, digamos que está enfocada en una puerta, el 99 por ciento de las veces la puerta está cerrada, para que el sensor de video pueda evaluar si la puerta está cerrada y que nadie entre o salga", dijo a DCD Mohamed Awad, vicepresidente de negocios de infraestructura de Arm.
"En algún momento, la puerta se abre y alguien entra por la puerta, y el sensor de video puede distinguir que no es una persona que se supone que debería cruzar la puerta y, por lo tanto, quiere enviarla de regreso a una computadora Edge móvil, que luego hace un reconocimiento facial para determinar quién es ", explicó Awad. "Y luego envía esos datos a la nube, y la nube realiza un análisis más detallado".
Awad lo ve como un sistema de extremo a extremo, donde "la computación pesada se ejecutará más cerca del núcleo, hacia el centro de datos, mientras que la computación más liviana se ejecutará más hacia el borde donde hay más sensibilidad en cuanto a potencia y costo y todo ese tipo de cosas ".
Arm, aunque ha tenido dificultades en el espacio de CPU del servidor, tiene una gran huella en el Edge: sus diseños de chips se encuentran en más de 130 mil millones de productos, incluidos esencialmente todos los teléfonos inteligentes. Su propietario, el gigante japonés de telecomunicaciones SoftBank, ve un mercado mucho más grande por delante, promocionando el elevado objetivo de un billón de dispositivos. "No está tan lejos", dijo Awad.
Esta explosión en el borde se produce al mismo tiempo que otro cambio transformador masivo: la inteligencia artificial. Por ejmplo, las cámaras de seguridad: cada una podría usar el procesamiento de IA para filtrar datos de video innecesarios y resaltar anomalías relevantes, algo que Nvidia espera atender con su nueva plataforma EGX, una arquitectura de referencia que viene en varios tamaños, desde el pequeño Jetson Nano, hasta un rack completo de servidores T4.
"Dependiendo de cuántas cámaras esté tratando de analizar, habrá una gama de soluciones de hardware bajo nuestra plataforma EGX", dijo Boitano. "Un micro servidor de IA que ejecuta Azure IoT puede procesar aproximadamente cuatro cámaras en los factores de forma pequeños, y luego un rack completo puede procesar hasta 3.000 cámaras".
El vicepresidente y director de operaciones de Intel de su grupo de productos de inteligencia artificial, Remi El-Ouazzane, ve una oportunidad de mercado similar para su compañía: "El mayor problema con las cargas de trabajo de visión es el ancho de banda, especialmente en el espacio de vigilancia. Si envía video 4K u 8K, 30 frames por segundo en su sistema, e implementa miles de cámaras: su red no lo soportará, su almacenamiento no lo soportará.
"Debes hacer IA en el Edge, para concentrarte en qué reaccionar o devolver". El-Ouazzane, quien fue CEO de la compañía de chips de visión por computadora de baja potencia Movidius antes de su adquisición por Intel, nuevamente ve al Edge como se extendió por varias capas, desde el dispositivo, hasta un punto de agregación, quizás hasta un servidor Edge y luego el centro de datos.
"Se trata de diferentes envolventes de alimentación dependiendo de si se trata de un dispositivo final o un punto de agregación. Cuando se trata de dispositivos, para la aceleración de IA, la envolvente de potencia se ubica en cualquier lugar entre una cuestión de milivatios, hasta tres vatios. Cuando observa puntos de agregación, obtiene entre 10 vatios de disipación de energía de hasta 50 vatios”.
Intel y Nvidia están lejos de estar solos en apuntar al mercado Edge AI, con un grupo de nuevas empresas que esperan que este nuevo frente en el mercado de chips AI ofrezca una oportunidad.
Entran los recién llegados
"Estoy concentrado en Edge", dijo a DCD Orr Danon, CEO de la compañía israelí de chips Hailo. "La mayor parte del procesamiento se realizará en Edge, donde hay muchos más datos que desea asimilar en representaciones más simples".
Recién salido de una ronda de financiación de 20 millones de dólares, la pequeña compañía espera que su procesador Hailo-8 termine en todo, desde cámaras de seguridad hasta vehículos autónomos, drones y más.
El chip de 26 teraops de Hailo (26 billones de operaciones por segundo) consume casi 20 veces menos energía que el Xavier AGX de Nvidia en los puntos de referencia ResNet-50, afirma la compañía. "Observamos cosas que van desde milivatios a unos pocos vatios, no estamos viendo cosas que son de cien a 1.000 vatios", dijo Danon.
Enfrentando a gigantes como Nvidia, Intel y Arm con sus enormes equipos y guerreros gigantes, es tentador descartar nuevos enfoques como Hailo. Danon, como era de esperar, no está de acuerdo: "Si se mira desde una perspectiva histórica, cada vez que hubo un gran cambio en las computadoras o el propósito para el que se utilizan las computadoras, se creó una gran oportunidad. Y los ganadores nunca fueron los jugadores establecidos, nunca, ", Dijo, destacando cómo IBM no pudo pasar de los mainframes y cómo Intel no pudo capitalizar el auge de los dispositivos móviles.
Danon cree que "cuando se observa una evolución de las arquitecturas, el jugador con más recursos y acceso al mercado siempre gana, pero cuando se trata de una revolución, en realidad es al revés". Su legado y compromisos lo retrasan”, dijo, citando ejemplos como Google versus Yahoo y Facebook versus Google.
Arm’s Awad también prevé una revolución, que abrirá el mercado a diversas formas de arquitectura informática. "Tenemos una arquitectura, y ciertamente queremos una arquitectura unificada, y queremos que sea nuestra. Pero somos realistas al respecto, ninguna arquitectura podrá resolver todos los problemas de lidiar con un billón de dispositivos. Va a requerir muchos tipos diferentes de cómputo que existen en muchos lugares diferentes con muchos perfiles diferentes. Y eso está bien”.