Blog de Analytics

Base de datos multidimensional: respuesta a las cuestiones más complejas del e-commerce

Escrito por Logicalis | 4/04/17 6:00

A diferencia del modelo relacional, unabase de datos multidimensionalestá optimizada para el procesamiento analítico en línea (OLAP) y el almacenamiento de datos. Esto lo consigue gracias a su estructura. La arquitectura de una base de datos de este tipo se compone de una combinación de datos de fuentes diversas que trabajan de forma simultánea ofreciendo redes, jerarquías, matrices y otras clases de formato de datos.


Créditos fotográficos: imply

Esta riqueza de perspectivas se representa en cubos de datos, cada uno de los cuales presenta las dimensiones disponibles para los usuarios. En estas matrices, los valores individuales de cada dato se hallan en una celda a la que es posible llegar a través de una variedad de índices.

El concepto de base de datos multidimensional está diseñado para ayudar con los sistemas de apoyo a la decisión y su principal valor es el ofrecer un medio óptimo para la resolución de cualquier tipo de consulta compleja. Uno de sus puntos fuertes es su rendimiento, muy superior al de las bases de datos relacionales.

 

 

Aplicaciones de la base de datos multidimensional

En la práctica, una de sus principales aplicaciones tiene que ver con el comercio electrónico. Cada tienda en línea tiene varios atributos que desea combinar para ganar en visión. Entre ellos, cabe destacar:

  • Información del tráfico.
  • Datos sobre los precios que la competencia asigna a cada producto.
  • Información actualizada sobre el inventario.

Cada una de estas áreas, a su vez, puede dividirse en decenas o cientos de perspectivas distintas. Por ejemplo, si tomamos el tráfico, podría resultar relevante conocer:

  • La procedencia de cada visita.
  • La ubicación geográfica del usuario.
  • La franja horaria en que accedió a la web de la empresa.
  • Qué otras páginas se han visitado, además del e-commerce.
  • Qué visitantes llegan por primera vez y cuáles habían visitado la tienda online anteriormente.

Si, las dimensiones elegidas acerca del tráfico se cruzan con otro tipo de atributos y sus dimensiones, podría llegarse a un análisis de negocio muy completo. No obstante, hay que tener claro que, para poder llegar a ese punto, antes hay que construir un modelo, cuya complejidad y coste quizás no estarían justificados.

Si el análisis de negocio planeado sólo implica algunas dimensiones y una lógica simple, es posible que no haga falta una base de datos multidimensional. Sin embargo, si se quiere obtener una visión más completa, llevar a cabo análisis what if o si se prevé que será necesario aplicar una lógica más compleja con matrices, cálculos estadísticos o medidas predictivas; entonces es preciso considerar los sistemas multidimensionales de DBMS.

Para un análisis tan complejo, es preciso que las nuevas dimensiones se tengan en cuenta automáticamente sin tener que escribir nuevas consultas, configurar paneles e informes. En un escenario así, no cabe plantearse otra opción que una base de datos multidimensional.

 

Base de datos multidimensional: el modelo a considerar

Al considerar el modelo de análisis para una base de datos multidimensional hace falta tener en cuenta las necesidades reales del negocio, el rendimiento mínimo esperado y también la rentabilidad.

El modelo que se construya permitirá:

  • Conocer los hechos, y todas sus dimensiones.
  • Entender las dimensiones y cada una de las jerarquías que la componen.
  • Contrastar ambas en todas sus posibilidades, pudiendo llegar a cotejar cientos de perspectivas diferentes.

En la práctica, volviendo al e-commerce, esto significa que la base de datos multidimensional podrá ser analizada atendiendo a cada hecho, por ejemplo, las compras realizadas por un usuario o un segmento en función de su variable tiempo, para cada año, trimestre o mes. Y, a la vez, se podrán estudiar los productos adquiridos, en base a jerarquías de familias y, a su vez, también en cuanto a cada tipo de producto y a cada producto en concreto.

Si bien en la teoría no existen límites al número de dimensiones del modelo, en realidad hay que preguntarse:

1. Si la base de datos multidimensional podrá soportar ese nivel de granularidad.

2. Si merece la pena crear un modelo de ese tamaño.

La respuesta puede llevar a la conclusión de que, aunque en algunos casos sea posible, en realidad no tenga sentido siquiera plantearse esa opción.

Debido a que las bases de datos multidimensionales tienen estructuras bastante rígidas construidas alrededor del cálculo previo de los hechos, cuantas más dimensiones tenga y cuantos más niveles presente cada dimensión, mayores serán los requisitos de almacenamiento y más elevados los tiempos necesarios para llevar a cabo acciones de construcción o de carga.

En cualquier caso, cuando la usabilidad y la rentabilidad comienzan a estar reñidas y, si además se sospecha que determinadas decisiones pueden afectar al rendimiento; lo adecuado es consultar a los usuarios.

Trabajando en estrecha colaboración con ellos desde el principio es más sencillo determinar si el número de dimensiones propuesto podría terminar convirtiendo a la solución en algo demasiado complejo y si es o no viable. Una posible solución, cuando la necesidad de negocio sea imperativa, podría ser limitar el volumen de usuarios con acceso a la base de datos multidimensional. De esta forma, se lograría restar complejidad. Si se prefiere una solución arquitectónica que mejore la facilidad de uso, entonces sería posible ampliar la población de usuarios.

Al elegir solución de base de datos multidimensional hay que buscar las alternativas que aseguren que son capaces de superar los típicos problemas de almacenamiento y complejidad causados por un gran número de dimensiones, o los que surgen como consecuencia de la profundidad en los niveles de jerarquía. Por último, es importante asegurarse de que las representaciones lógicas que acompañan a los productos tienen la capacidad de satisfacer las necesidades empresariales.