Blog de Analytics

Calidad de datos y credibilidad

Escrito por Logicalis | 11/07/15 6:00

¿Sabes en qué consiste la calidad de datos? ¿Conoces en qué grado es necesaria para el social media analytics? ¿Te parece relevante la credibilidad como uno de sus atributos? Más que la propia calidad de datos en sí, o sus cualidades, el debate dentro de la industria de gestión de la información versa en torno a las posibles consecuencias de la mala calidad de los datos en entornos operativos y analíticos. Qué significa calidad no es tan importante como la percepción que las empresas tienen de ella.

Créditos fotográficos: istock robcocquyt

Y es que existen muchas dimensiones diferentes de calidad de datos, perspectivas que, siendo realistas, se asume que es imposible cubrir al 100% (la inversión requerida no justificaría los resultados). Sin embargo, una de estas facetas es la credibilidad, una de las dimensiones analizadas con mayor frecuencia. Pero ¿en qué consiste?

 

De la calidad de datos a la credibilidad de la información

La credibilidad de los datos es el grado en que se puede verificar o conocer a ciencia cierta que los datos realmente representan lo que se supone que han de representar. Este atributo de la calidad de datos está ligado a la fuente origen o el proveedor de datos, en quien no debe haber indicio de mala fe o pruebas de intención de falsificación.

Dados los impresionantes avances en la tecnología y el volumen de información disponible, la credibilidad de datos se ha vuelto más importante que nunca y las redes sociales están en el punto de mira de quienes valoran la credibilidad por encima de todo.

Los medios de comunicación social son, hoy en día, un importante catalizador para proyectos de grandes datos pero, desafortunadamente, también son el área más vulnerable en lo que a calidad de datos concierne, ejemplo de ello es lo sencillo que puede resultar, por ejemplo, el aumentar de forma artificial las cifras en redes sociales:

  • Comprando seguidores en Twitter.

  • Jugando con los "Like" de Facebook.

  • Haciendo un interpretación "libre" del número de impresiones que recibe un blog (multiplicando el número de Tweets por el número de seguidores de cada tweet).

La preocupación por la credibilidad debe estar al mismo nivel que la que se tiene por la búsqueda de la calidad de datos. Los datos generados a partir de alimentaciones de medios sociales proporcionan a las organizaciones una poderosa manera de conectar con los clientes actuales y potenciales para crear interés en sus productos. El interés genera clicks, likes, comentarios, opiniones y todo esto genera ingresos, que a su vez determinan el éxito o el fracaso de un negocio y sus sostenibilidad.

Pero claro, esta regla se cumple si y sólo si los datos que se reciben del social media, los que después se analizarán para aportar conocimiento y visión a la toma de decisiones; son creíbles... y, demasiado a menudo, no es el caso.

Los datos sucios son tan peligrosos como los datos poco fiables y las consecuencias de ambos para una organización pueden tener un impacto devastador, sobre todo si se considera que el social media analytics, al igual que otras técnicas de análisis avanzado, se basan en la calidad de esos datos para apoyar la toma de acción empresarial.

 

Post relacionados: