Blog de Analytics

Cómo mejorar la calidad de datos para la analítica de negocio

Escrito por Logicalis | 19/06/15 6:00

Contar con datos de calidad es hoy uno de los principales valores al alza en cualquier sistema corporativo de gobernanza y gestión de la información. Efectivamente, la calidad de datos como nueva magnitud a considerar ha penetrado con fuerza en la escala de prioridades de toda analítica de negocio, hasta el punto de devenir un factor determinante de su éxito o fracaso.

Pero, ¿a qué nos referimos cuando hablamos de calidad de datos (o data quality)? ¿Cuáles son los principales factores de riesgo y dónde se originan? ¿Hasta qué punto influye la calidad de datos en el éxito o el fracaso de una estrategia data analytics? Hoy trataremos de responder a estas y otras cuestiones relacionadas con ellas.

 

Riesgos y repercusiones de la calidad de datos

Por calidad de datos se entiende el nivel y el grado de adecuación de los datos recabados a los intereses de la compañía (su significación respecto al enfoque de la explotación de los mismos), su carácter completo o incompleto, su veracidad y fiabilidad (la consistencia en términos de referencia a elementos reales), y su homogeneidad.

Demarcada la cuestión, lo primero y más fundamental (incluso antes de revisar la calidad de los datos ya contenidos en las data warehouses de la organización) es detectar los posibles focos de riesgos y amenazas para la calidad de los datos que se recaban.

Las posibles amenazas a la calidad de los datos se generan, principalmente, en los siguientes focos:

 

  • En los sistemas y las fuentes de datos, cada día más variadas y diversas.

  • En las operaciones de migración y trasvase de datos (para la cuestión, recomendamos encarecidamente la lectura de la guía Claves para mitigar el riesgo en una migración de datos).

  • En los procesos de adquisición de bases de datos externas, producto de una operación de compra o fusión empresarial (al unificar registros).

  • En errores propios de los sistemas transaccionales.

 

A parte de estas amenazas, existen otros riesgos para la calidad de datos que es oportuno conocer para tomar las medidas adecuadas con el fin de prevenirlos:

 

  • Cuando los datos se utilizan para fines distintos a los que propiciaron su almacenamiento, se pueden producir incompatibilidades o errores de diversas magnitudes.

  • Si los estándares de explotación presentan diferencias con los mantenidos a la hora de cargar los datos en las data warehouses se pueden originar disfunciones y errores.

 

Dicho esto, no hace falta ser expertos en la materia para advertir hasta qué punto la calidad de los datos se trasvasa a las informaciones que se obtienen a partir de ellos, y consiguientemente, por extensión, al conocimiento generado, clave para una toma de decisiones acertada. Por ello, como decíamos al empezar, la calidad de los datos deviene un asunto de crucial importancia a la hora de definir una estrategia corporativa de de gestión de datos y gobernanza de la información, una cuestión que nos puede ayudar a comprender mejor la guía 10 claves para definir tu estrategia corporativa de gestión de datos, disponible completamente gratis en el apartado de recursos formativos de este mismo blog. 

 

Post relacionados: