Cuando se habla de gestión de datos en proyectos de Data Warehouse, uno de los requisitos para lograr el éxito es conocer cuál es la situación de partida. Sumergirse en la realidad presente del negocio implica:
- Entender sus necesidades.
- Plantear una opción compatible con la arquitectura técnica existente.
- Encontrar una solución que pueda dar cobertura también al futuro de la compañía.
- No perder alineación con la estrategia de gestión de datos corporativa.
Es indispensable tener el conocimiento exacto sobre el tipo de negocio de la organización, pero también lo es el alcanzar una óptima comprensión acerca del tipo de soporte que representa la información dentro de todo su proceso de toma de decisiones, como antesala de las acciones que conducirán a la materialización de la visión y misión de la empresa.
El vehículo sobre el que se proyecta esta evolución son los datos. Ellos permiten, a través de transformaciones, integraciones y agregaciones, obtener información crítica del negocio. En la práctica, esto se traduce en la necesidad de recopilar información sobre los costes de fabricación, costes de distribución, de montaje, etc. para poder, por ejemplo, conocer el margen de beneficio que deja cada venta de productos.
Sólo así, unificando criterios, condensando la información y eliminando la dispersión de los datos, algo que tiene mucho que ver con la forma de entender su dinamismo temporal; es posible obtener información crítica. Ésta es, en definitiva, la función primordial del Data Warehouse, aunar estos dos mundos que corren por separado: el de la logística y el de la venta o distribución que, al asociarse, permiten acceder a un análisis detallado, completo y veraz sobre productos o clientes, independientemente de las circunstancias que en ellos confluyan y su procedencia.
Necesidades de negocio y orígenes de datos: definiendo la estructura del Data Warehouse
Antes de poder proceder a la conjunción de datos procedentes de diversas fuentes hay que identificar los orígenes de datos que alimentarán el DWH. Generalmente, este proceso supone un recorrido por:
- Sistemas fuentes.
- Tablas donde se ubican los datos.
- Campos o ficheros que contienen información.
- Y, por supuesto, también toda esa información no digital o manual, que también debe ser tenida en cuenta.
Los resultados de esta búsqueda exhaustiva establecerán todos los elementos que han de ser tenidos en cuenta en el contexto analítico. Se ha alcanzado el nivel de conocimiento preciso acerca de las necesidades del negocio y también se conocen los lugares de donde toda esa información puede extraerse.
A partir de aquí, se puede comenzar a establecer qué estructura tendrá el DWH, para lo cual es necesario definir el modelo de datos conceptual, que es el orientado a la descripción de las estructuras de datos y sus restricciones de integridad.
Los modelos de datos de este tipo se suelen utilizar durante la etapa de análisis de un problema dado y por eso buscan dar respuesta a las siguiente cuestiones:
- Cuáles son los elementos que intervienen en ese conflicto.
- Qué relación existe entre ellos.
Se trata de un modelo de alto nivel que permitirá separar conceptualmente las diferentes áreas temáticas de negocio, alcanzando también a explicar el modo en que se producen las distintas interrelaciones. Una vez perfeccionado el modelo de datos conceptual, se puede comenzar a preparar el siguiente paso: la evolución a los modelos de datos lógicos y físicos.