El data warehousing (o almacenamiento de datos) es una actividad fundamental en cualquier entorno corporativo. Los datos son uno de los bienes y activos más importantes con los que cuenta cualquier organización, y ya hemos comentado en numerosas ocasiones hasta qué punto es determinante contar con una adecuada estrategia de gestión de los mismos.
Gestionar convenientemente los datos y las informaciones albergadas en las data warehouses requiere, en primer lugar, contar con un cierto volumen y variedad de datos que justifiquen la adopción de un sistema de gobernanza de la información. Evidentemente, sin materia prima que gestionar, cualquier estrategia orientada a este fin no es más que humo. Una condición que, pese a ser absolutamente necesaria, no es en modo alguno suficiente.
Uno de los principales fines que persigue una data warehouse, más allá del simple almacenamiento de datos, es servir a las demandas corporativas de análisis e información. Por ello, a la hora de concebir y diseñar una base de datos, se debe tener en cuenta que no se trata únicamente de un espacio (físico o virtual) en el que se alojan indiscriminadamente y en desorden todos los datos de una organización, sino de un espacio que debe cumplir con unas características muy concretas y definidas:
Orientación: los datos siempre remiten a ciertos aspectos o temas de la realidad. Una realidad que puede ser pasada (datos históricos), presente (datos operativos, funcionales...) o incluso futura (datos relativos a escenarios posibles), pero que en cualquier caso debe servir para orientar (ordenar) los datos almacenados según su referente o remisión.
Variabilidad: las data warehouses no son en absoluto estáticas; todo lo contrario, se están alimentando constantemente con nuevos datos e informaciones. Una base de datos que no permita una correcta recepción, fluidez, actualización y renovación de los mismos es obsoleta desde el mismo momento de su creación.
Involatilidad: una data warehouse es variable y flexible, pero a la vez debe evitar la volatilidad, es decir, velar por el mantenimiento y la integridad de los datos consulta para garantizar que estos mismos datos e informaciones no se alteran con las consultas que se realizan, y que estarán disponibles para demandas futuras de información.
Integración: estrechamente relacionada con la orientación de los datos, esta característica de las data warehouses garantiza la integración de nuevos datos procedentes de distintas fuentes en un formato consistente, evitando inconsistencias, errores y conflictos de toda índole.
Enumeradas estas características básicas de las data warehouses, que hemos definido como espacios de almacenamiento orientados al análisis y la gestión de datos e información, queda definir la metodología de data warehousing más conveniente para cada tipo de organización, es decir, el modo más conveniente de albergar estos datos e informaciones para su uso posterior.
Tradicionalmente, existen dos tipos de metodología o estrategias de gobernanza de la información, la apuesta por una de las cuales condicionará de un modo determinante el diseño de la data warehouse corporativa:
Descendente o top-down: es la metodología definida por uno de los primeros investigadores en el ámbito del almacenamiento de datos, Bill Inmon, caracterizada por una estrategia de gestión de la información que parte de las necesidades corporativas para estructurar los datos y las informaciones en función de estas.
Ascendente o bottom-up: metodología defendida por Ralph Kimball (otro nombre referente en la cuestión), consistente en considerar la data warehouse como la suma de todas las data mart de una organización. Su estructuración, por lo tanto, no depende en primera instancia de las necesidades concretas de información de las organizaciones, sino que parte de los mismos datos y de sus características o tipologías.
IBM InfoSphere QualityStage, una de las soluciones de inteligencia de negocios ofrecidas por IBM, ayuda a las empresas a ofrecer datos de calidad para su big data, inteligencia empresarial, data warehousing, migración de aplicaciones y proyectos de gestión de datos maestros.
Para ampliar esta información, recomendamos la lectura de la guía gratuita 10 claves para definir tu estrategia corporativa de gestión de datos, donde se exponen, entre otros asuntos de interés, las claves para definir la estrategia data warehousing y de gestión de datos más adecuada para cada tipo de organización.
Post relacionados:
Modelos predictivos: reforzando el valor de una buena decisión
Internet de las Cosas: nuevas alianzas para afrontar los nuevos retos