Blog de Analytics

DWH: un repositorio renovado y con vistas al lago

Escrito por Logicalis | 27/06/17 6:00

La reforma de la vivienda permite aprovechar el espacio disponible de una forma más eficiente, elimina todos esos tabiques, ornamentos y elementos accesorios que no aportan valor ni utilidad y hace posible ganar en luminosidad. En lo que respecta al DWH (data warehouse), un proyecto de modernización iría en la misma línea, facilitando el obtener beneficios como:

1. Una eficiencia infraestructural mejorada.

2. Mayor amplitud.

3. Luz sobre los datos.

Créditos fotográficos: funky-data

 

 

Imagina que en ese proyecto de actualización del DWH lo conectas a un data lake. ¿Puede haber alguna forma mejor de explotar el potencial de la inteligencia de negocio?

La modernización del data warehouse es necesaria en muchas organizaciones que quieren impulsar su desarrollo. Han llegado a un punto en que su almacén de datos ya no trabaja al rendimiento esperado. El acceso se complica, el análisis se ve limitado y los procesos de negocio sufren, como consecuencia de todo ello, una ralentización.

La puesta a punto del DWH les permitiría:

  • Cumplir las expectativas de los usuarios: eficiencia y velocidad podrían escalar al mismo ritmo al que lo hacen los volúmenes de información almacenados.
  • Optimizar la estructuración de datos: a medida que se agrega más información al almacén, la estructuración de datos se complica y puede ralentizar el proceso significativamente, complicando también la calificación de datos para el análisis que lleva a cabo el administrador del sistema. La reforma hace posible diseñar y configurar cuidadosamente herramientas de análisis de datos, facilitando el alcanzar mejores resultados.
  • Alinearse con las necesidades de negocio: el almacenamiento de datos está impulsado por la información que proporciona y, por eso, cuanto mejor sea el modelo inicial, más rápida y económica será su implementación.
  • Ganar en calidad: como sucede en toda reforma, al modernizar un DWH se limpia la información logrando asegurar niveles de calidad de datos superiores.

Los beneficios están claros, pero, ¿cuál es la estrategia a seguir para poner al día la arquitectura del almacén de datos?

 

La actualización del DWH

La modernización del data warehouse debe, para empezar trabajar en su ampliación. El proyecto de puesta al día ha de iniciar tomando algunas decisiones a este respecto y, entre las estrategias al alcance de la mayoría de organizaciones se encuentran las siguientes:

  1. Estrategias de modelado.
  2. Estructuras in – memory.
  3. Procesamiento masivo paralelo.
  4. Índice agrupado de columnas.

 

Hay que intentar que el proyecto de modernización permita superar la rigidez de un formato que, pese a haber resultado de gran valor a la organización, necesita de algunos retoques para continuar prestando la utilidad que se espera de él. En concreto, se trata de garantizar que el DWH será capaz de:

  • Dar soporte a los usuarios de la organización, independientemente de su perfil o necesidades.
  • Facilitar el análisis de grandes volúmenes de datos, sin que importe su procedencia.
  • No limitar la analítica avanzada.
  • Alinearse con las expectativas de escalabilidad y rendimiento del sistema.
  • Promover el empoderamiento usuario, a través del autoservicio de la información.
  • Integrarse con servicios en la nube.
  • Permitir el acceso a datos en streaming a través de distintas APIs.
  • Alinearse con nuevos escenarios, como los relacionados con la computación cognitiva.

El almacenamiento de datos tradicional sigue siendo necesario y mantiene su importancia, si bien, hay que tener en cuenta que este tipo de infraestructura necesita coexistir con otras plataformas. Habrá que prepararse para trabajar en tiempo real, moverse en escenarios híbridos, esforzarse por asegurar la integración y no perder de vista la estrategia que permita gestionar de forma adecuada un volumen de datos que no deja de crecer.

Por eso, una vez realizadas estas 5 acciones, para completar la actualización del DWH hay que pensar en extender su arquitectura. Y existen distintas formas de conseguirlo.

 

Los extras que multiplican las posibilidades del DWH

La extensión de un data warehouse puede llevarse a cabo de distintas formas. Las tres soluciones que se proponen a continuación pueden implementarse por separado o de forma conjunta, en función de las necesidades del negocio y la madurez tecnológica de la organización.

Para olvidarse de los límites en las capacidades del almacén de datos se puede recurrir a:

1. Soluciones cloud e híbridas

2. Soluciones analíticas o de almacenamiento de datos complementarias.

3. Virtualización de datos.

El objetivo de una iniciativa de este tipo es extender los límites del DWH. Un data lake o soluciones de datos virtualizadas permiten a la organización multiplicar exponencialmente la utilidad de sus recursos de conocimiento y, por ejemplo, ganar en capacidad para acceder a varias plataformas informacionales sin necesidad de realizar la integración completa de datos. Lograrlo permite reducir las latencias, poder llevar a cabo analítica en tiempo real, ganar en flexibilidad y velocidad y garantizar la accesibilidad de los datos allá donde se encuentren.

Este último hito resulta especialmente importante en determinadas situaciones, como las que se presentan cuando la ventana para la migración de datos es muy pequeña, cuando los volúmenes de datos son demasiado grandes para que su traslado sea viable o práctico o cuando, por motivos de cumplimiento, no conviene extraer los datos almacenados en una determinada ubicación e importarlos a otra geográficamente distinta.

Por último, no hay que olvidar que, en un proyecto de DWH, la planificación es importante. Hay que ser realista y conocer hasta dónde se puede llegar. En este proceso habrá que enfrentarse a desafíos de tipo tecnológico, como los relacionados con la complejidad de la arquitectura, el rendimiento o la gestión del cambio; retos relacionados con los usuarios, como los que tienen que ver con la propiedad de los datos, las capacidades tecnológicas o las expectativas; y, también dificultades inherentes al propio proceso de modernización del almacén de datos, que son las que tienen que ver con la calidad de la información, la seguridad o el gobierno.