Los sistemas ETL (Extraction, Transform, Load) permiten, entre otras muchas ventajas, integrar datos procedentes de distintas fuentes y sistemas de origen en los data warehouse, con el fin de unificar criterios para el análisis y la gestión de datos, y facilitar el material suficiente a las herramientas que cumplen con este objetivo (analizar y gestionar grandes volúmenes de datos) para que proporcionen información amplia e integral sobre la organización.
No cabe duda de que, en la transformación de los sistemas ETL, el surgimiento de nuevas fuentes de datos ha desempeñado un papel crucial. Desde la ingente proliferación de aplicaciones móviles, hasta el enriquecimiento constante y en crecimiento exponencial de las bases de datos de libre acceso (open data), alimentadas con los datos procedentes del uso de herramientas tecnológicas de toda índole, los sistemas de origen de los que cabe extraer datos son cada vez más cuantiosos, complejos y diversos, algo que inevitablemente obliga a los sistemas ETL a evolucionar.
Las redes sociales: grandes retos para los sistemas ETL
Evidentemente, el surgimiento y la expansión de las redes sociales ha dispuesto un horizonte lleno de nuevas oportunidades de negocio. Sin embargo, y paralelamente, también ha establecido un escenario en el que la mejora de los sistemas de extracción, transformación e integración de datos (ETL) ha devenido una constante, una necesidad tan imperiosa como urgente.
No cabe duda de que la mejora y la optimización de las herramientas para la extracción de datos ha sido una prioridad de primer orden para desarrolladores, y una necesidad no menos acuciante para sus consumidores corporativos (el correcto desempeño de las estrategias de gestión de datos de compañías y organizaciones de toda índole dependen directamente de ello). En este aspecto se ha avanzado enormemente, logrando capear uno de los mayores inconvenientes que presentaba la extracción de grandes volúmenes y variedad de datos, procedentes de una gran diversidad de sistemas de origen: la saturación, o lo que se ha venido denominando como «cuello de botella».
Hoy, la extracción de datos en las condiciones que hemos descrito no plantea grandes retos desde el punto de vista técnico, gracias a la increíble evolución experimentada por los sistemas ETL. Sin embargo, en el proceso de transformación es donde hallamos, actualmente, las principales barreras tecnológicas, y donde las herramientas diseñadas para ello tienen un mayor margen de mejora por delante.
Entre los principales retos planteados por la transformación y el tratamiento de los datos extraídos de fuentes tan diversas como las redes sociales, artífices clave de la evolución de los sistemas ETL, destaca la posibilidad de automatizar reglas y protocolos de transformación personalizados, dada la imposibilidad material de crearlos manualmente para cada una de las fuentes de origen, las tipologías de los datos (extremadamente variadas) y los requisitos de los distintos sistemas de destino en los que se deben integrar.
Cada nueva fuente de datos trae consigo grandes dificultades en lo que a tratamiento y transformación de estos datos se refiere, sobre todo cuando se los pretende integrar en sistemas de destino en los que convergerán con datos previamente transformados y cargados.
No tardaremos en hablar de novedades en este asunto, a todas luces crucial para sacar el máximo partido a la estrategia de gestión de datos adoptada por cualquier organización. En este sentido, y para entender hasta qué punto es conveniente disponer de una estrategia corporativa de gestión de datos lo suficientemente sólida y versátil para aprovechar las oportunidades que ofrecen las redes sociales, entre otras fuentes de datos destacadas, resulta especialmente indicada la lectura 10 claves para definir tu estrategia corporativa de gestión de datos, disponible completamente gratis.
Post relacionados: