Blog de Analytics

Modelo de datos: los errores que salen más caros

Escrito por Logicalis | 9/02/16 7:00

Un modelo de datos no es sino una abstracción de algún aspecto de un problema que afecta al negocio. Con el modelado se consigue describir cómo los datos se representan y cómo se accede a ellos desde una base de datos. Este tipo de construcciones, además de la complejidad técnica que entrañan, son una de las tareas más difíciles de la ingeniería de software; suelen tener una relevancia determinante para el éxito o el de un proyecto. A día de hoy, y a pesar de la experiencia en modelado de datos que las empresas van acumulando, todavía se dan errores que podrían evitarse, fallos en un modelo de datos que merman su utilidad y eficacia, limitando al negocio en sus decisiones y acciones.

Crédito fotográficos: istock defokes

 

Fallos en el modelo de datos

Para conocer, entender y evitar los errores que pueden aparecer en un modelo de datos, antes hay que tener en cuenta tres aspectos:

  1. Existen muchos factores en el proceso de construcción de un modelo de datos donde pueden originarse los fallos.
  2. Algunos patrones de modelado son más propensos a determinados errores que otros.
  3. Los técnicos suelen atribuir diferentes tipos de errores para los distintos tipos de patrones de modelado.

Partiendo de estas premisas se puede empezar a investigar las causas de algunos de los errores en un modelo de datos que más pueden costarle a un negocio, ya sea por el tiempo y los recursos invertidos o por las consecuencias de ver mermadas las propias capacidades analíticas a la hora de enfrentarse a big data.

Un modelo de datos pierde eficacia o disminuye su utilidad cuando:

A/ Se exagera con su tamaño: cuando las dimensiones del modelo de datos no están realmente justificadas se está aumentando su complejidad de forma ilógica. Esta decisión conduce a un aumento de las probabilidades de aparición de errores de diseño. Evitar este error requiere de un planteamiento coherente, al que preceden cuestiones como:

  • Si el tamaño está justificado realmente y el trabajo que implica el desarrollo de la aplicación vale la pena.
  • Si hay algún contenido que puede eliminarse (por ejemplo, los especulativos).
  • Si es posible y viable cambiar la representación y hacer el modelo más conciso.

También es posible evitar el sobre-modelado durante el propio desarrollo si se intenta mantener las cosas simples y se siguen las indicaciones del modelo de datos evitando demasiadas entidades sin atributos clave o con muy pocos de ellos, un elevado número de objetos de modelado con denominaciones irreconocibles para los usuarios de negocios o problemas derivados de los nombres de los atributos.

B/ Falta claridad o es difícil adivinar el propósito de la acción misma de modelado: el propósito del modelo de datos determina el nivel de detalle que se necesita. Si no está seguro acerca del mismo, por desconocimiento o falta de claridad de los requisitos, es muy probable que se termine construyendo algo demasiado detallado o, por el contrario, excesivamente breve y superficial.

 

Post relacionados: