Por Ohad Shalev es director de marketing de productos en SQream


En el panorama empresarial actual, los datos son un factor determinante. Pero el éxito no se logra simplemente poseyendo esos datos: sin la capacidad de obtener conocimientos profundos basados ​​en datos, el verdadero valor de los datos organizacionales prácticamente se desperdicia.

Para que los datos se analicen y conviertan de manera más efectiva en conocimientos significativos, los ingenieros de datos deben “prepararlos” adecuadamente, un proceso que incluye el preprocesamiento de datos (limpieza, integración, transformación, agregación, conversión de formato y reducción) y la discusión de datos (filtrado, agrupación, mejora de funciones y mejora de la precisión). 

Desafortunadamente, para las empresas que manejan cargas de trabajo complejas y con uso intensivo de datos, la preparación de datos puede requerir incluso más tiempo y costos que el procesamiento analítico en sí: hoy en día, los procesos de preparación de datos consumen alrededor del 80 por ciento del tiempo y los recursos de un proyecto. 

A medida que la complejidad de las cargas de trabajo de datos continúa creciendo, se contradice la importancia crítica de los datos "siempre listos" (datos que pueden prepararse rápidamente para el procesamiento analítico) y, por lo tanto, fácilmente accesibles y utilizables en casi cualquier momento.

GettyImages-1488294044.width-358
– Getty Images

Desafíos de datos para las empresas modernas

Para las empresas actuales, mantenerse competitivas incluye su capacidad para preparar y dar sentido a cargas de trabajo de alta complejidad y uso intensivo de datos. Esto significa procesar y analizar hasta miles de terabytes de datos nuevos por día para obtener nuevos conocimientos y predicciones.

“Por día” es la frase operativa aquí, así como el principal obstáculo. La información oportuna es crucial para seguir el ritmo de un panorama empresarial en rápida evolución. Pero para mantenerse actualizadas, las empresas a menudo deben hacer concesiones en la cantidad de datos que están preparando. Si bien eso puede aumentar la velocidad con la que producen análisis importantes, es probable que perjudique la calidad y eficacia generales de sus decisiones comerciales basadas en datos.

Preparación rápida de datos

¿Cómo funciona exactamente la preparación de datos y por qué requiere tanto tiempo y recursos?

No existe un método predefinido para preparar datos. Más bien, es un proceso de prueba y error que depende de la fuente de datos y del caso de uso previsto. Si el proceso lleva demasiado tiempo, prolonga el tiempo desde las fases de iteración hasta las de experimentación, consumiendo recursos valiosos en el camino.

Cada canal de datos define sus propios requisitos de rendimiento y tiempo de respuesta del acuerdo de nivel de servicio (SLA): el tiempo mínimo que una empresa se compromete a facilitar un servicio o resolver un problema dentro de un caso de uso específico. Por ejemplo, la frecuencia con la que se actualiza el panel y los detalles que se incluirán en el panel.

Para garantizar la disponibilidad de los datos para fines comerciales, las empresas harían bien en acelerar los canales de datos mediante la automatización, comprobando periódicamente su precisión y confiabilidad a lo largo del tiempo.

Flexibilidad para cada escenario o requisito

Imagine vivir en un mundo donde los datos se preparan de forma continua, es decir, los datos se preparan tan rápido, independientemente de la cantidad, que siempre están listos. Esta realidad permitiría a las empresas responder con prontitud a las necesidades comerciales cambiantes y a los desafíos inesperados. Además, minimizaría la acumulación de tickets y solicitudes, lo que otorgaría a los ingenieros de datos tiempo para ser más proactivos y productivos.

Una forma de facilitar esto es mediante el uso de un lago de datos en la nube. Con él, los datos se pueden preparar directamente en el almacenamiento en la nube, sin los largos tiempos de carga que normalmente requiere el procesamiento de datos basado en ELT (extraer, cargar y transformar).

Para las empresas que gestionan cargas de trabajo complicadas y con gran cantidad de datos, el resultado es revolucionario en múltiples frentes. Una infraestructura de datos ágil, respaldada por un desempeño de costos superior, brindará a las empresas un medio eficiente para adaptarse a la dinámica cambiante del mercado, los nuevos proyectos y las demandas fluctuantes de los clientes.

Potenciar el análisis ad hoc

Más allá de la flexibilidad que otorga a los ingenieros de datos, los datos siempre listos también les permiten realizar consultas y análisis ad hoc como una forma de obtener información y predicciones procesables sobre la marcha. Después de todo, si los datos de una empresa están “siempre listos”, se pueden tomar decisiones críticas casi en tiempo real, proporcionando así una clara ventaja competitiva.

Y gracias a su compatibilidad con herramientas de inteligencia empresarial, las consultas y análisis ad hoc no solo simplifican la exploración de datos, sino que también aceleran las pruebas de iteración, lo que acorta significativamente el tiempo necesario para completar un proyecto.

Perspectiva del futuro

Los datos pueden ser un ingrediente clave para la inteligencia empresarial y el éxito, pero se necesita algo más que tener datos para competir de manera efectiva. Los ingenieros de datos, los científicos de datos y los analistas de negocios deben poder descubrir las “pepitas secretas” encerradas en ese tesoro de datos, y rápidamente.

Afortunadamente, la preparación rápida de datos puede poner al día a las empresas. Con datos “siempre listos”, las decisiones comerciales urgentes nunca necesitan estar a merced del procesamiento de datos tradicionalmente engorroso.

Las fuerzas cambiantes del mercado influyen en los datos que las empresas modernas tienen a su disposición: depende de ellas extraer los conocimientos empresariales ocultos en ellos y actuar en consecuencia.