Si bien la estrategia de gestión de datos corporativa es una iniciativa que afecta a todos los ámbitos de la organización encargados de administrar y procesar la información de negocio; es también importante centrarse en las claves a tener en cuenta para la gestión de datos en proyectos de Data Warehouse, siguiendo las premisas marcadas por una sólida estrategia corporativa.
El propósito del datawarehousing es facilitar la toma de decisiones y, por eso, a pesar de la variedad y dinamismo de los datos que contiene, su principal atributo debe ser la integridad, en el sentido de unificación. Un recorrido por el DWH de una compañía debe reflejar un concepto transmisor de realidad y, para lograrlo, debe ir un paso más allá de los niveles puramente transaccionales u operativos. El Data Warehouse, su diseño y también su modelado han de buscar favorecer el análisis complejo.
Sin embargo, un Data Warehouse no es sólo un almacén inteligente de datos, el datawarehousing alude también a todos los procesos y herramientas requeridas para proporcionar los ingredientes necesarios al procesamiento de datos, que no son otros que:
- ETL: extracción, transformación y carga.
- Generación de información.
- Gestión de datos y metadatos.
Gestión de datos: el éxito en un proyecto de Data Warehouse
Hablar de Kimball e Inmon es remontarse a los orígenes de los almacenes de datos. Estos expertos en la materia, impulsores del concepto de Data Warehousing como se conoce actualmente, sentaron las bases del DWH, de forma que de su conocimiento es posible extraer las claves para lograr el éxito en un proyecto de estas características.
Créditos fotográficos: Ralphfan99
Para Ralph Kimball, un almacén de datos es "una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis". El hincapié que hace en la misión y estructura del DWH hace entrever la importancia de aplicar una metodología bottom up que, en sentido ascendente sea capaz de recorrer todos los datamarts de una entidad, ya que así es como concibió originalmente el diseño de un Data Warehouse.
Por su parte, Bill Inmon, prefirió centrarse en los repositorios de datos y sus características, factor clave del buen curso de un proyecto de DWH según sus apuntes, y que reflejan su preferencia por la aplicación de una metodología top down. Estas staging areas deben reunir las siguientes características:
- Integridad: han de contener datos consistentes y llegados de todos los sistemas de la organización sin excepción.
- Peso: la información no puede ser volátil. Desde el momento en que un dato queda almacenado no ha de poder ser modificado ni erradicado del sistema.
- Agrupación: las bases de datos deben organizar los datos por temas eventos u objetos del mundo real al que vincularse. Todos los que puedan clasificarse de la misma manera han de quedar ligados.
- Trazabilidad: todas las transformaciones que se produzcan en los datos a lo largo de su ciclo de han de registrarse para garantizar la calidad del análisis.
Asegurando esta orientación, sus teorías aseguran que se alcanza una comprensión más sencilla del conjunto de datos corporativos para así, avanzando en sentido descendente, culminar el diseño del almacén de datos. A diferencia de las enseñanzas de Kimball, para Inmon los datamarts no son una tarea prioritaria y, por eso, relega su creación al momento de concluir la construcción del Data Warehouse de la organización.