La proliferación de las redes sociales, el incremento en el número de usuarios y las posibilidades que ofrecen para dar a conocer al público la misión, la visión, los productos y los servicios ofrecidos por cualquier compañía han abierto las puertas a nuevas oportunidades de negocio. Unas oportunidades que, a la vez, conllevan retos de distintas magnitudes, algunos de los cuales son fácilmente dirimibles si disponemos de las herramientas necesarias para ello.
Entre estos retos, sin duda, destaca el relacionado con la gestión y el análisis de los datos que provienen de las redes sociales, lo que conocemos como Social Media Analytics; datos que no solo pueden tener una relevancia macroscópica —para el conjunto de la organización— sino, también y muy especialmente, una relevancia a niveles micro, especialmente para los departamentos y las áreas encargadas de diseñar, gestionar, y administrar la estrategia de comunicación que adopte la compañía en estos nuevos escenarios.
Por todo ello velar por la calidad de los datos (un asunto de máxima importancia en cualquier contexto) deviene vital en entornos Social Media, en los que muchas veces, por las características propias del medio, lo que conocemos por Data Quality se puede ver seriamente comprometido.
Hasta no hace mucho tiempo, uno de los principales objetivos de las estrategias enmarcadas en entornos de inteligencia de negocios consistía en hallar nuevas fuentes para recabar más volumen y más variedad de datos, todo ello con la mayor velocidad. Volumen, variedad y velocidad que no tardaron en erigirse como las 3 características definitorias del Big Data, planteando lógicamente retos considerables para la gestión y la administración de datos, y relegando la obtención de los mismos a un segundo plano en la escala de prioridades.
Alcanzado el objetivo, es decir, contando cada vez con más dispositivos, herramientas y canales que incrementan exponencialmente las «3 V» del Big Data, entra en juego un cuarto factor, una cuarta dimensión que adquiere hoy una gran relevancia: el Data Quality, la calidad de los datos obtenidos que, como decíamos, se puede ver seriamente comprometida según la naturaleza de sus fuentes.
Las redes sociales son unas de las principales fuentes de datos que alimentan (o son susceptibles de alimentar) las data warehouses de las compañías y las organizaciones más diversas. Sin embargo, no todas están adecuadamente preparadas para una inyección de datos de un volumen, una variedad y a una velocidad semejantes, y menos aún con una calidad tan diversa y dispar.
Los modelos ETL (extracción, transformación y carga de datos) tradicionales, que cargan directamente los datos transformados en las data warehouses no permiten garantizar una calidad adecuada de los datos que se cargan, además de presentar importantes inconvenientes para una gestión eficaz y eficiente de los mismos; por ello, cada vez deviene más imprescindible contar con sistemas que incorporen plataformas de mediación en las que los datos converjan para ser tratados, es decir, plataformas en las que cargar los datos procedentes de distintas fuentes antes de que las herramientas de extracción y análisis procedan a detectar aquellos que, por su relevancia y calidad (completitud, veracidad, originalidad...), puedan/deban ser cargados en los respectivos sistemas de destino.
La apuesta por la calidad debe constituir una prioridad en cualquier estrategia de gestión de datos que se precie. Consiguientemente, implementar nuevos sistemas ETL que incorporen herramientas como la plataforma data hub es, más que recomendable, crucial. Esta cuestión, junto a otras de suma importancia en relación con lo expuesto aquí está tratada con detalle en la guía 10 claves para definir tu estrategia corporativa de gestión de datos, un recurso disponible completamente gratis en nuestro apartado de recursos formativos.
Post relacionados:
Big Data, una prioridad en el diseño de nuevas propuestas formativas