Blog de Analytics

Estructuras multidimensionales de los cubos OLAP

Escrito por Logicalis | 24/07/15 6:00

Una base de datos multidimensional

El acrónimo OLAP procede de la expresión en inglés OLAP cubeOn-Line Analytical Processing, o procesamiento analítico online, usada para designar los sistemas de análisis de datos basados en estructuras multidimensionales, o lo que frecuentemente se denomina cubos OLAP.

Los cubos OLAP son estructuras multidimensionales (cubos) que permiten analizar bases de datos relacionales de gran volumen y variedad con una gran agilidad y rapidez, reduciendo enormemente el tiempo y los recursos empleados en el análisis.

 

 

Los cubos OLAP: conceptos básicos y funcionalidades

Existen distintos sistemas OLAP diferenciados entre sí, básicamente, por los tipos de bases de datos sobre los que se construyen y que dan lugar, entre otras y principalmente, a las siguientes categorías o sistemas: 

  • Sistemas ROLAP: construidos sobre bases de datos relacionales que emplean, principalmente, esquemas de copo de nieve o de estrella. Es un sistema apto para analizar grandes volúmenes de datos.

  • Sistemas MOLAP: en esta ocasión las bases de datos sobre las que trabaja el motor OLAP son de tipo multidimensional. Presenta algunas ventajas frente al modelo anterior, como la mejora de la rapidez en el almacenamiento de datos, la optimización del rendimiento de la memoria caché, o la eficiencia en la extracción de datos (debido a la necesidad de que estos estén previamente tratados o preestructurados); sin embargo, también presenta algunas desventajas, entre otras el riesgo de duplicidad en los datos analizados (especialmente cuando se trabaja con cierto número de dimensiones), o la complejidad del proceso de carga de los datos en las bases debido a lo que comentábamos hace un momento (estos deben ser tratados o preestructurados en el momento de cargarlos).

  • Sistemas HOLAP: combinan los sistemas ROLAP (relacionales) con los MOLAP (multidimensionales). Se recomienda almacenar los datos más recientes en MOLAP para mejorar la rapidez de los análisis, y los más antiguos o de menor uso en ROLAP, dada la facilidad que presenta para su almacenamiento.

Hecha esta aclaración de tipo conceptual, debemos concebir los cubos OLAP como bases de datos multidimensionales compuestas de medidas o dimensiones, y creadas a partir de los esquemas de las tablas empleadas en las bases de datos relacionales (las tablas, en concreto sus registros, proporcionan las medidas de los cubos, y sus dimensiones vienen determinadas por las dimensiones de los cuadros con los que cuenta cada tabla).

Debemos tener muy en cuenta que los cubos no sustituyen a las tablas relacionales; simplemente ayudan a mejorar la eficiencia, la velocidad de respuesta y la simplicidad de las consultas, pero deben apoyarse siempre en un modelo relacional con los datos previamente normalizados.

Como vemos, la arquitectura de las bases de datos es un asunto crucial para el correcto uso de los cubos OLAP, una cuestión que, entre otras (como la definición de la política de administración de datos más pertinente, la gestión de la seguridad u otros asuntos relacionados con el data warehousing).