El modelo relacional es un modelo de gestión de los datos albergados en las data warehouses (o bases de datos) diseñado para dar una respuesta eficaz a los retos planteados por el ingente volumen, la creciente variedad y la mayor velocidad en la afluencia de los datos que debe manejar una organización.
Sus principios se basan en la teoría de conjuntos y la lógica de predicados, mediante los cuales el modelo establece relaciones entre datos que permiten almacenarlos en función de las mismas, superando los escollos que se presentaban utilizando otro tipo de modelos (como el jerárquico, o el modelo en red), en los que la relevancia del orden en el que se almacenaban los datos planteaba serios problemas a la hora de lidiar con la duplicidad, la validez y/o la desnormalización de los registros.
Hoy por hoy, la mayoría de las soluciones para el análisis y la gestión de datos utilizan el modelo relacional, un modelo relativamente simple que permite sacar el máximo partido a los datos con los que cuenta una organización, pero que al mismo tiempo debe conocerse con detalle para explotar al máximo sus posibilidades.
Los datos corporativos se alojan en bases de datos que poseen las características del modelo empleado a la hora de tratarlos. Así, una base de datos relacional estará formada por el conjunto de tablas —o relaciones, estructuradas a su vez en campos (columnas) y registros (filas)— que se hayan obtenido tras aplicar un modelo relacional, estableciendo campos comunes entre distintos datos o conjuntos de datos.
Estas bases relacionales, como avanzábamos en la introducción, se someten a un proceso de «normalización» que permite usarlas de un modo óptimo y máximamente eficiente, permitiendo afrontar los problemas también antes comentados, derivados del uso de otros modelos de gestión: principalmente, evitar duplicidades en los registros y mantener la integridad de las dependencias establecidas entre los mismos.
Al mismo tiempo, el uso de un sistema relacional o de bases de datos relacionales plantea algunos obstáculos que, contando con la información necesaria, son fácilmente superables (una información que recursos como la guía gratuita 10 claves para definir tu estrategia corporativa de gestión de datos aporta en abundancia).
Algunos de estos retos o problemáticas no devienen únicamente con la adopción de un sistema relacional para la gestión de datos corporativos, por lo que muchas de las soluciones posibles también son aplicables a otros modelos de gestión y a arquitecturas de datos distintas.
Entre las tareas a afrontar para mejorar la calidad de los datos y optimizar al máximo su gestión mediante un modelo relacional, debemos tener en cuenta las siguientes de un modo destacado:
Verificación de metadatos: al importar datos desde otra data warehouse, sus metadatos —que establecen, entre otras cuestiones, sus relaciones, la propiedad y la cardinalidad de los mismos— deben ser verificados.
Resolución de posibles ambigüedades: a la hora de realizar consultas y/o automatizarlas, la ambigüedad de las relaciones entre datos puede generar errores de distintos calibres y con consecuencias diversas. Por ello, «limpiar» las relaciones ambiguas (datos que refieren a más de un contexto o rol, con relaciones reflexivas entre sí, etc.) y concretar, clarificar las relaciones entre datos es crucial para explotar al máximo un modelo relacional.
Simplificación del modelo: los modelos relacionales se prestan a ser sometidos a una simplificación de los mismos, que deviene necesaria cuando el volumen y la variedad de datos albergados alcanzan ciertas magnitudes. Para ello, basta con identificar y distinguir entre datos dimensionales y datos de hechos (las tablas centrales de los esquemas dimensionales), y aplicar esquemas en estrella a las capas lógicas del modelo.
Post relacionados: