Contar con datos de calidad es hoy uno de los principales valores al alza en cualquier sistema corporativo de gobernanza y gestión de la información. Efectivamente, la calidad de datos como nueva magnitud a considerar ha penetrado con fuerza en la escala de prioridades de toda analítica de negocio, hasta el punto de devenir un factor determinante de su éxito o fracaso.
Pero, ¿a qué nos referimos cuando hablamos de calidad de datos (o data quality)? ¿Cuáles son los principales factores de riesgo y dónde se originan? ¿Hasta qué punto influye la calidad de datos en el éxito o el fracaso de una estrategia data analytics? Hoy trataremos de responder a estas y otras cuestiones relacionadas con ellas.
Riesgos y repercusiones de la calidad de datos
Por calidad de datos se entiende el nivel y el grado de adecuación de los datos recabados a los intereses de la compañía (su significación respecto al enfoque de la explotación de los mismos), su carácter completo o incompleto, su veracidad y fiabilidad (la consistencia en términos de referencia a elementos reales), y su homogeneidad.
Demarcada la cuestión, lo primero y más fundamental (incluso antes de revisar la calidad de los datos ya contenidos en las data warehouses de la organización) es detectar los posibles focos de riesgos y amenazas para la calidad de los datos que se recaban.
Las posibles amenazas a la calidad de los datos se generan, principalmente, en los siguientes focos:
-
En los sistemas y las fuentes de datos, cada día más variadas y diversas.
-
En las operaciones de migración y trasvase de datos (para la cuestión, recomendamos encarecidamente la lectura de la guía Claves para mitigar el riesgo en una migración de datos).
-
En los procesos de adquisición de bases de datos externas, producto de una operación de compra o fusión empresarial (al unificar registros).
-
En errores propios de los sistemas transaccionales.
A parte de estas amenazas, existen otros riesgos para la calidad de datos que es oportuno conocer para tomar las medidas adecuadas con el fin de prevenirlos:
-
Cuando los datos se utilizan para fines distintos a los que propiciaron su almacenamiento, se pueden producir incompatibilidades o errores de diversas magnitudes.
-
Si los estándares de explotación presentan diferencias con los mantenidos a la hora de cargar los datos en las data warehouses se pueden originar disfunciones y errores.
Dicho esto, no hace falta ser expertos en la materia para advertir hasta qué punto la calidad de los datos se trasvasa a las informaciones que se obtienen a partir de ellos, y consiguientemente, por extensión, al conocimiento generado, clave para una toma de decisiones acertada. Por ello, como decíamos al empezar, la calidad de los datos deviene un asunto de crucial importancia a la hora de definir una estrategia corporativa de de gestión de datos y gobernanza de la información, una cuestión que nos puede ayudar a comprender mejor la guía 10 claves para definir tu estrategia corporativa de gestión de datos, disponible completamente gratis en el apartado de recursos formativos de este mismo blog.
Post relacionados: