<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1500086133623123&amp;ev=PageView&amp;noscript=1">

Cinco consejos sobre proyectos de Data Warehouse

Publicado el 16/06/14 17:30

dwh1

  • Elección de soluciones BI aplicadas a la gestión de datos: la capa de explotación debe permitir la mejora del análisis estratégicos, la toma de decisiones y el emprendimiento de acciones empresariales mediante el uso de sistemas. Las soluciones de inteligencia empresarial pueden clasificarse en scorecards, informes y dashboards, informes predefinidos, informes a medida, consultas (query) / cubos OLAP (on-line analytic processing), alertas, análisis, análisis estadístico, pronósticos (forecasting), minería de datos, optimización, y minería de procesos. La elección de la solución adecuada debe contemplar las necesidades de negocio.
  • Análisis estratégico: la gestión de datos debe dar respuesta a las consultas estratégicas de la compañía, las necesidades de información crítica para la toma de decisiones y al potencial integrador para presentar una visión única de la realidad. Una de las claves para garantizar el éxito es atender a las buenas prácticas desde la fase de diseño y modelado. El objetivo debe ser ganar alineación con el negocio en función a sus necesidades a la vez que se minimizan riesgos, erradicando errores, discrepancias, duplicidades y datos incompletos. El automatismo a través de la herramienta adecuada es la única alternativa para alcanzar la visión única que optimice procesos y reduzca costes.

Descubre los mitos alrededor del concepto de Big Data

  • Gestión de datos: para cumplir con su principal cometido de facilitar la toma de decisiones, la principal característica del Data Warehouse debe ser la capacidad de unificación, por lo que su diseño y su modelado han de favorecer el análisis complejo. Más allá de almacenar, debe proporcionar los elementos para el procesamiento de datos: ETL (extracción, transformación y carga), Generación de información y Gestión de datos y metadatos. La metodología bottom-up permite todos los datamarts de una entidad en sentido ascendente. Las staging areas deben proporcionar integridad (datos consistentes llegados de todos los sistemas), peso (la información almacenada no puede ser borrada del sistema), agrupación (según temas o eventos del mundo real, los que estén relacionados entre sí deben quedar ligados) y trazabilidad (registrar las transformaciones para garantizar la calidad del análisis).
  • Gestión del Data Warehouse y del Business Analytics: definir la arquitectura de datos en función de las necesidades de datos para la inteligencia de negocio. Para ello hace falta conocer las fuentes de datos, los procesos ETL correspondientes, entrenar a los profesionales e implementar data warehouses y datamarts, herramientas de BI e interfaces de usuario, dashboards y scorecards de gestión y aplicaciones analíticas y de reporting. Tener en cuenta los elementos ambientales (roles y responsabilidades, tecnología, organización y cultura, actividades, prácticas y técnica, inputs y outputs informacionales). Planificar las actividades reales de inteligencia de negocio ejecutadas por los trabajadores (reporting y consultas, análisis estadístico y multidimensional, minería de datos, modelado de escenarios condicionados, control y análisis del desempeño de negocio). De esta forma se alcanzará una perspectiva global integrada y muy realista, optimizando la toma de decisiones.
  • Modelado y diseño: definición de dos bases de datos para diseñar la arquitectura de datos. Por un lado, ODS o Staging Area (capa intermedia entre los sistemas fuente y el Data Warehouse que permite gestionar los datos con el formato y la estructura originales y facilitar la integración y conversión hacia el modelo desnormalizado de Datamarts y Data Warehouses. Es decir, de las tablas a la estructura común). Por otro lado, Data Warehouse: estructurado en Tablas Maestras (dimensiones conformadas, pilares que establecen relaciones entre datamarts en las dimensiones comunes) y Datamarts (modelados de estrella o desnormalizados, modelados de copo de nieve). Los Datamarts se componen de dimensiones temáticas y tablas de hecho (transaction, factless/coverage, periodic snapshot, accumulating snapshot). Tanto ODS como DWH exigen primero un modelo de datos lógicos como un modelo de datos físicos.

 

Post relacionados:

 

Recursos sobre Business Intelligence y Gestión de la Información