Blog de Analytics

Modelado de datos: las mejores prácticas menos teóricas

Escrito por Logicalis | 29/03/17 0:00

El diseño de un modelado de datos es el principio de una mejora notable en los resultados de negocio, en la comunicación empresarial y en el rendimiento técnico. No obstante, para lograr este nivel de éxito hace falta conseguir que las interrelaciones lógicas y los flujos de datos entre los distintos elementos de datos queden bien representadas. Conocer el tipo de datos y el formato en que éstos serán requeridos es importante en este proceso, aunque también hace falta tener en cuenta algunas mejores prácticas.

 

Créditos fotográficos: v_alex

 

El modelado de datos bien diseñado

Lograr un modelado de datos bien diseñado es una cuestión de preparación. Los profesionales que se encarguen de esta tarea deben entender la importancia de llevar a cabo la planificación adecuada y, para ello deberán:

1. Comprender la naturaleza de los datos con los que se va a trabajar. Lanzarse a la codificación sin más puede acarrear problemas asociados a los plazos que, una vez la iniciativa está ya en marcha, resultarán difíciles de resolver.

2. Evitar que el modelado de datos se lleve a cabo de forma simultánea con el desarrollo de software. Puesto que si la guía que ofrece un buen plan, no es posible completar la construcción con la misma eficacia.

3. Tener claras las necesidades del negocio. Una planificación cuidadosa es la mejor forma de asegurar que se logra una base de datos adecuada, que no necesitará ser revisada de forma tan frecuente y que garantizará su utilidad, evitando que el trabajo deba ser desechado y reemplazado. Pese a que no es posible predecir cada necesidad de diseño de antemano, merece la pena hacer el esfuerzo de entender los datos y su uso.

4. Basarse en un enfoque ágil para el diseño y desarrollo del modelado de datos. Este marco de trabajo conseguirá que el resultado se adapte mejor a las expectativas, aunque, en ningún caso, implica que se pueda prescindir de la planificación previa. Lo recomendable es dedicar los sprints iniciales al diseño de los datos.

5. Recordar que es la información contenida en los datos la que da sentido a las aplicaciones, y no al contrario. Los datos contribuyen de forma sustancial al proceso de desarrollo y, sólo por eso, han de ser tenidos en cuenta.

Los desarrolladores deben comprender la importancia de los datos y su contribución al proceso de desarrollo. Vivimos en la era de la información. Las aplicaciones muestran y manipulan datos y es precisamente la información contenida en los datos lo que da sentido a la aplicación.

No es posible prever todos los requisitos ni todos las cuestiones que pueden surgir, pero es importante prepararse para los problemas a afrontar mediante una planificación cuidadosa.

 

La documentación del modelado de datos

Al hacer un modelado de datos puede caerse en el error de considerar que todo es demasiado evidente. Éste es un error importante puesto que, aunque en las fases de diseño y etapas iniciales del desarrollo las cosas parezcan obvias, si no se nombra a los objetos de forma que su propósito quede claro, será muy complicado que se entienda el significado de lo que implican con sólo leer su denominación. La documentación tiene que ver con comunicar el diseño y hacerlo comprensible en el futuro.  Para que un modelado de datos quede bien documentado es importante recordar que:

1. Hay que dejar claro cuál será el uso de cada objeto en el momento de escoger nombres para tablas y columnas.

2. Conviene llegar a un acuerdo en cuanto a la nomenclatura. Este paso será de gran ayuda si, en el futuro, es preciso hacer cualquier tipo de cambio.

3. Puede resultar útil elaborar un documento corto y sencillo donde queden descritas las decisiones y pasos tomados en el proceso de diseño.

4. El propósito de la documentación debe ser el permitir que la base de datos pueda ser administrada por un nuevo administrador, al que los significados de cada elemento del modelado de datos de datos le queden claros. Sólo así será capaz de mantenerlo e introducir los ajustes que se requieran en cada momento.

5. El ahorro en documentación durante el desarrollo implicará un aumento de los costes futurosen cualquier iniciativa relacionada con cambios en la base de datos, identificación de problemas o seguimiento de errores, entre otros.

 

El modelado de datos: de la integridad a la estrategia de archivado

La integridad es una de las cualidades más importantes de un modelado de datos y, para preservarla, hace falta observar dos reglas:

1. Para garantizar la integridad de los datos, son necesarias claves y restricciones externas. Ambos elementos son necesarios y su contribución al modelado de datos es positiva, aunque, en la práctica, hay que evitar infrautilizar estos controles de integridad. Hacerlo sería igual de pernicioso para los resultados que abusar de ellos. En este sentido, las tablas de dominios son eficaces para reforzar la integridad puesto que se trata de un recurso muy efectivo en los casos en que existen muchos valores que deben ser comprobados. También resultan recomendables en el caso de que los valores que se van a comprobar cambien con frecuencia.

2. Las aplicaciones también deben realizar comprobaciones de integridad, pero no dependen sólo de ellas mismas para verificarla. La definición de reglas de integridad en la base de datos asegura que esas reglas nunca serán violadas. De esta manera, los datos satisfacen las reglas de integridad definidas en todo momento.

Por último, no puede completarse un proyecto de modelado de datos sin definir una estrategia de archivado. Las consecuencias de la falta de consenso a este respecto son la incertidumbre y el despilfarro de recursos.

Hace falta conocer durante cuánto tiempo se mantendrán los datos disponibles en línea en tablas de bases de datos activas. No siempre es necesario conservar estos registros indefinidamente, ni es razonable, ni es práctico y, por eso, en algún momento, los datos activos deben ser archivados.

Para gestionar este aspecto eficientemente se puede incluir la retención de datos como parte de las consideraciones de diseño.