Un modelo de datos no es sino una abstracción de algún aspecto de un problema que afecta al negocio. Con el modelado se consigue describir cómo los datos se representan y cómo se accede a ellos desde una base de datos. Este tipo de construcciones, además de la complejidad técnica que entrañan, son una de las tareas más difíciles de la ingeniería de software; suelen tener una relevancia determinante para el éxito o el de un proyecto. A día de hoy, y a pesar de la experiencia en modelado de datos que las empresas van acumulando, todavía se dan errores que podrían evitarse, fallos en un modelo de datos que merman su utilidad y eficacia, limitando al negocio en sus decisiones y acciones.
Crédito fotográficos: istock defokes
Fallos en el modelo de datos
Para conocer, entender y evitar los errores que pueden aparecer en un modelo de datos, antes hay que tener en cuenta tres aspectos:
- Existen muchos factores en el proceso de construcción de un modelo de datos donde pueden originarse los fallos.
- Algunos patrones de modelado son más propensos a determinados errores que otros.
- Los técnicos suelen atribuir diferentes tipos de errores para los distintos tipos de patrones de modelado.
Partiendo de estas premisas se puede empezar a investigar las causas de algunos de los errores en un modelo de datos que más pueden costarle a un negocio, ya sea por el tiempo y los recursos invertidos o por las consecuencias de ver mermadas las propias capacidades analíticas a la hora de enfrentarse a big data.
Un modelo de datos pierde eficacia o disminuye su utilidad cuando:
A/ Se exagera con su tamaño: cuando las dimensiones del modelo de datos no están realmente justificadas se está aumentando su complejidad de forma ilógica. Esta decisión conduce a un aumento de las probabilidades de aparición de errores de diseño. Evitar este error requiere de un planteamiento coherente, al que preceden cuestiones como:
- Si el tamaño está justificado realmente y el trabajo que implica el desarrollo de la aplicación vale la pena.
- Si hay algún contenido que puede eliminarse (por ejemplo, los especulativos).
- Si es posible y viable cambiar la representación y hacer el modelo más conciso.
También es posible evitar el sobre-modelado durante el propio desarrollo si se intenta mantener las cosas simples y se siguen las indicaciones del modelo de datos evitando demasiadas entidades sin atributos clave o con muy pocos de ellos, un elevado número de objetos de modelado con denominaciones irreconocibles para los usuarios de negocios o problemas derivados de los nombres de los atributos.
B/ Falta claridad o es difícil adivinar el propósito de la acción misma de modelado: el propósito del modelo de datos determina el nivel de detalle que se necesita. Si no está seguro acerca del mismo, por desconocimiento o falta de claridad de los requisitos, es muy probable que se termine construyendo algo demasiado detallado o, por el contrario, excesivamente breve y superficial.
Post relacionados:
- La minería de datos directa e indirecta en el BI de nueva generación
- Big Data España:en todas partes
- Ventajas de la analítica de datos en una propuesta de valor