La forma de llevar a cabo la planificación de las medidas destinadas a preservar la calidad de los datos impactará de forma decisiva en los resultados del análisis. Se trata de ir un paso más allá de la simple garantía de disponibilidad, completitud, relevancia y volumen suficientes de los datos. Hay que elaborar un programa donde se determine el modo de actuar, se definan objetivos y se designe a los responsables de cada iniciativa y acción a tomar.
Créditos fotográficos: istock NREY
Las áreas donde potenciar la calidad de datos
Existen tres áreas de gran influencia de la calidad de datos para la analítica de negocio. A la hora de diseñar una programación respecto a las acciones de data quality que se habrán de emprender, es imprescindible tomarlas en consideración. Asegurar la calidad en estos tres grandes pilares de la inteligencia empresarial es preservar su sostenibilidad y maximizar el rendimiento de analytics. Se trata de los siguientes:
1. Fuentes de origen: pese a que implica un desempeño mucho más laborioso que el trabajar la calidad de los datos simplemente en función de los propios datos, el aseguramiento de las condiciones de calidad suficientes y deseadas pasa por un trabajo en origen. De otro modo, cada vez que se procediese a una captura de datos se estaría corriendo el riesgo de hacer descender el umbral de calidad general alcanzada, con los consiguientes efectos para el análisis y la toma de decisiones empresarial.
2. Sistemas de almacén de datos: cada medio empleado para conservar los datos, cada data warehouse de que el negocio disponga debe contar con su propio sistema de aseguramiento de la calidad. La forma idónea de proveerlos de estas garantías es mediante herramientas de detección automática que permitan identificar a tiempo cualquier problema de calidad de datos que aparezca, de forma que se pueda poner solución antes de que sus efectos adversos se propaguen a lo largo y ancho de la organización.
3. Procesos de negocio: los usuarios finales, al entrar en contacto con la inteligencia empresarial de diferentes maneras a través de su trabajo diario tienen la ocasión de advertir defectos de calidad en los datos. Su misión no es otra que comprometerse a mantenerse alerta para poder proceder a notificar a quien corresponda acerca de este tipo de irregularidades, para que se puedan evaluar y se tomen las acciones necesarias encaminadas a recuperar los niveles de calidad perdidos.
La importancia del seguimiento para la calidad de datos
Por supuesto, un plan consistente requiere de monitorización. Las circunstancias evolucionan y el negocio se adapta dinámicamente a los cambios lo que implica la posible aparición de problemas de calidad de datos. Un buen plan de data quality ha de tener prevista esta circunstancia y prever la necesidad de monitorización.
Esta función de control puede organizarse en torno a las siguientes acciones:
1. Determinación de un calendario de actuación: la programación ha de estar expresada en términos claros, incluyendo un glosario si se considera necesario; y debe ser compartida.
2. Establecimiento de la frecuencia de evaluación: la periodicidad de las acciones de descubrimiento y evaluación de la calidad de los datos se determinará en función de la criticidad de la información contenida en los datos y la relevancia de las áreas a que afecten.
3. Designación de los responsables: la ausencia de propietarios de los datos es el principal problema de fondo en un elevado porcentaje de cuestiones de data quality. Asignar responsabilidades y llegar a un consenso es la mejor prevención.
4. Definición de los requisitos de reporting: la retroalimentación es imprescindible para fomentar el flujo de conocimiento y garantizar la actualización. Para maximizar la eficiencia de esta comunicación han de establecerse los términos en que se levará a cabo.
Post relacionados: