Todo proyecto de migración de datos debe poder garantizar la calidad de los mismos. Este principio impone la aplicación de procesos de Data Quality en cualquier traslación de este tipo. Y es que la calidad de los datos debe ser una preocupación prioritaria para las organizaciones. De hecho, la base de la inteligencia de negocio radica en poder operar sobre datos confiables e íntegros. La ausencia de calidad incide directa, y nefastamente, en este requisito que ha de preservarse desde el minuto cero de una migración de datos.
Créditos fotográficos: "Hand Touching Analysis Button" by Stuart Miles
La investigación de los datos es una fase muy necesaria en todo proyecto de migración de datos. Como siempre, obtener información veraz y precisa es fundamental y, para ello, es importante:
- Investigar la totalidad de los datos que quedarán sujetos al proceso de migración.
- No realizar ningún descarte ni emplear mayores recursos en la investigación de unos datos, relegando la de otros.
- Contar con todos los inputs que sea posible en el curso de la investigación: desde los propietarios del dato hasta los usuarios que interactuaron con él en algún momento, si se considera necesario.
- Contrastar la información obtenida.
- Validar las conclusiones alcanzadas, también en el momento de finalizar la etapa de calidad.
Llevar a cabo, de manera correcta, la investigación de datos que da inicio a un proceso de migración tiene mucho que ver con la sistematización. Así, en esta etapa, hay que ser capaz de:
- Descubrir potenciales anomalías en los datos.
- Alcanzar un 100% de visibilidad de los campos de contenido libre.
- Identificar valores por defecto e inválidos.
- Revelar reglas de negocio indocumentadas.
- Garantizar la veracidad de los datos contenidos en los campos que se emplearán para los criterios de emparejamiento.
- Entender los datos en su contexto.