Blog de Analytics

Modelo de datos: calidad y contexto

Escrito por Logicalis | 5/05/15 6:00

Los resultados de big data analytics se reducen, muchas veces, a una cuestión de calidad. En este sentido, es el modelo de datos donde reside el potencial necesario para asegurar la idoneidad de la toma de decisiones, pero debe implementarse en condiciones óptimas ya que, de lo contrario, podrían poner trabas al negocio en vez de apoyarlo.

No siempre se logran los resultados esperados, ya que los sistemas e interfaces a menudo requieren un gran esfuerzo en lo relativo a su construcción y mantenimiento y la calidad debe asegurarse en todo momento en el proceso de data modelling. Pero, ¿dónde residen las principales dificultades?

 

Créditos fotográficos: istock defokes


Los principales retos que un modelo de datos debe superar para lograr que big data analytics dé los resultados esperados tienen que ver con:

  • Los cambios en las reglas del negocio: pequeñas transformaciones en estas reglas, que están ligadas a la estructura del modelo de datos tienen un gran impacto en los sistemas e interfaces. La necesidad de actualización es crucial para evitar la pérdida de utilidad y precisión de éstos, que conduciría a errores y desajustes en el futuro.

  • La definición de los tipos de entidad: los tipos de entidad a menudo no están definidos o carecen de precisión en la definición, lo que puede conducir a la replicación de los datos, su estructura y funcionalidad. Cuando esto sucede, los costes de dicha duplicidad repercuten en el desarrollo y mantenimiento.

  • La falta de visión: a veces los modelos de datos para los diferentes sistemas son distintos. Un escenario así puede darse cuando cada sistema es abordado de forma independiente, sin tener en cuenta cómo podrían necesitar ser compartidos los datos en el futuro. Ante situaciones de este tipo la única solución es construir complejas interfaces entre los sistemas, con el fin de compartir los datos.

  • La incompatibilidad: fijar el modelo de datos a la base de datos física no es suficiente para asegurar la compatibilidad entre ambas entidades. La configuración de aquél es crítica para prevenir este tipo de problemas.

  • La estandarización: los datos pierden su valor cuando no pueden ser compartidos fácilmente de forma electrónica con clientes y proveedores. Si esto sucede es porque la estructura y el significado de los datos no han sido estandarizados.

En definitiva, la mayoría de estos desafíos tienen que ver con la falta de coherencia. El modelo de datos ha de diseñarse y desarrollarse para cumplir con las necesidades del negocio, el objetivo último también de big data analytics. Conocer las metas de la organización y definir las normas adecuadas que aseguren esta funcionalidad no es una opción. Además, en este proceso hay que intentar que la creación del modelo de datos facilite tres acciones:

  • Reducir la redundancia en las definiciones de datos.

  • Impulsar la limpieza y armonización de datos.

  • Usar conjuntos de datos contextualizados.

 

Post relacionados: