Contar con datos de calidad es hoy uno de los principales valores al alza en cualquier sistema corporativo de gobernanza y gestión de la información. Efectivamente, la calidad de datos como nueva magnitud a considerar ha penetrado con fuerza en la escala de prioridades de toda analítica de negocio, hasta el punto de devenir un factor determinante de su éxito o fracaso.
Pero, ¿a qué nos referimos cuando hablamos de calidad de datos (o data quality)? ¿Cuáles son los principales factores de riesgo y dónde se originan? ¿Hasta qué punto influye la calidad de datos en el éxito o el fracaso de una estrategia data analytics? Hoy trataremos de responder a estas y otras cuestiones relacionadas con ellas.
Por calidad de datos se entiende el nivel y el grado de adecuación de los datos recabados a los intereses de la compañía (su significación respecto al enfoque de la explotación de los mismos), su carácter completo o incompleto, su veracidad y fiabilidad (la consistencia en términos de referencia a elementos reales), y su homogeneidad.
Demarcada la cuestión, lo primero y más fundamental (incluso antes de revisar la calidad de los datos ya contenidos en las data warehouses de la organización) es detectar los posibles focos de riesgos y amenazas para la calidad de los datos que se recaban.
Las posibles amenazas a la calidad de los datos se generan, principalmente, en los siguientes focos:
En los sistemas y las fuentes de datos, cada día más variadas y diversas.
En las operaciones de migración y trasvase de datos (para la cuestión, recomendamos encarecidamente la lectura de la guía Claves para mitigar el riesgo en una migración de datos).
En los procesos de adquisición de bases de datos externas, producto de una operación de compra o fusión empresarial (al unificar registros).
En errores propios de los sistemas transaccionales.
A parte de estas amenazas, existen otros riesgos para la calidad de datos que es oportuno conocer para tomar las medidas adecuadas con el fin de prevenirlos:
Cuando los datos se utilizan para fines distintos a los que propiciaron su almacenamiento, se pueden producir incompatibilidades o errores de diversas magnitudes.
Si los estándares de explotación presentan diferencias con los mantenidos a la hora de cargar los datos en las data warehouses se pueden originar disfunciones y errores.
Dicho esto, no hace falta ser expertos en la materia para advertir hasta qué punto la calidad de los datos se trasvasa a las informaciones que se obtienen a partir de ellos, y consiguientemente, por extensión, al conocimiento generado, clave para una toma de decisiones acertada. Por ello, como decíamos al empezar, la calidad de los datos deviene un asunto de crucial importancia a la hora de definir una estrategia corporativa de de gestión de datos y gobernanza de la información, una cuestión que nos puede ayudar a comprender mejor la guía 10 claves para definir tu estrategia corporativa de gestión de datos, disponible completamente gratis en el apartado de recursos formativos de este mismo blog.
Post relacionados: