Blog de Analytics

Analítica de datos de redes: el antes y el después

Escrito por Logicalis | 2/05/17 6:00

Antes de empezar a pensar en la analítica de datos de redes, hay que tener claro en cuántas fuentes de datos la organización confía para la toma de decisiones. Todos estos orígenes de la información deberán ser tomados en consideración y evaluados con sujeción a un plan.


Créditos fotográficos: BrianAJackson

 

Analítica de datos de redes: cantidad y calidad

El uso de datos internos y externos es un elemento esencial para la buena toma de decisiones. Desde que los negocios han probado los resultados de la analítica de datos de redes ya no impulsan sus acciones en base a intuiciones, corazonadas o información que no sea del todo objetiva.

Las organizaciones no se conforman y amplían sus redes de conocimiento, llegando a recurrir a más de 20 redes en algunos casos (internas en el 18% de los casos y externas en el 13%); aunque lo normal es no pasar de 5 fuentes de información, como hacen cerca de la mitad de las organizaciones (40% cuentan con hasta 5 fuentes internas y el 56% la misma cifra de externas), según datos de BI-Survey.

Pero, ¿el análisis de datos de redes es una cuestión de calidad? No exactamente. Pese a que es cierto que las empresas que utilizan más fuentes de datos internas y externas poseen un mayor rango de posibilidades para analytics, a la hora de escoger diferentes orígenes para la construcción de conocimiento, hay que tener en cuenta que:

  • Es aconsejable la variedad. No hay que conformarse con los históricos del data warehouse de la compañía, puesto que, de hacerlo así, se estaría privando al análisis de una importante perspectiva.
  • Conviene combinar fuentes externas e internas. Las herramientas analíticas actuales permiten procesar información de distintos orígenes y en formatos diversos. Para la mayoría, el volumen no supone ningún obstáculo e, incluso en condiciones de análisis big data, son capaces de proporcionar respuestas en un tiempo muy reducido.
  • La integración del conocimiento procedente de fuentes de datos internas y externas es necesaria para garantizar la calidad en los resultados.

Precisamente la calidad de datos es uno de los problemas que más afectan a los resultados de la analítica de datos de redes. A mayor número de fuentes de información, mayores probabilidades de experimentar complicaciones de data quality.

En ocasiones se trata de un problema de calidad per se, que puede estar inducido por la entrada de datos manual o la falta de automatización de algunos procesos; si bien también puede derivarse de un gobierno de datos poco robusto o, directamente, de la inadecuada gestión de activos informacionales en la compañía. Para evitarlos, hay que prestar atención a la preparación.

 

Más allá de la preparación para la analítica de datos de redes

Dado el carácter intrínseco de la analítica de datos de redes a la toma de decisiones, la preparación para analytics ha de considerarse como parte sustancial de la estrategia de gestión de la información en la empresa.

En este plan de adecuación de los datos, se pueden diferenciar 3 momentos distintos con sus correspondientes propósitos:

1. Descubrimiento: esta fase corresponde a la búsqueda que lleva al analista a encontrar los datos más adecuados para servir a su fin. Para aumentar la eficiencia de este estadio hay que ampliar el espectro de fuentes a las que recurrir para la analítica de datos de redes, sin olvidarse de tener presente el requisito de idoneidad. Será preciso filtrar los datos para quedarse con los que realmente aportan utilidad al proceso.

2. Comprensión: la visualización es el mejor aliado de quienes se encargan de esta parte del proceso. Permite agilizar la inspección de datos que conduce al aprendizaje. Tras ganar en comprensión acerca de la información con la que se trabajará, es preciso aplicar técnicas de perfilado de datos que serán el preludio del hallazgo de correspondencias, dependencias e interrelaciones entre los datos.

3. Transformación: los datos en crudo no resultan tan útiles para el análisis y, por eso, hace falta limpiarlos, de-duplicarlos, validarlos y transformarlos. Una vez se han aplicado todas estas acciones es interesante enriquecer los datos resultantes, para asegurar su completitud. No debe darse por concluida esta fase sin antes conocer cuál es el nivel de agregación que se requiere para poder responder a las preguntas del usuario de negocio, tras lo que se ha de modelar la información, dejándola lista para su interacción con el análisis de datos de redes y los procesos de inteligencia empresarial.

Una vez que los datos han sido trabajados, llega el momento de practicar el análisis. Las conclusiones extraídas deberán ser compartidas y reutilizadas. Hablamos de los data sets, de los datos maestros, las definiciones, los metadatos… el análisis de datos de redes es fuente de conocimiento y éste debe ser aprendido por los sistemas de BI para hacer a la organización más inteligente.

Por supuesto, los esfuerzos analíticos no han de quedar aislados y, por eso, las organizaciones han de tener presente la importancia del data governance y de una adecuada gestión. Ambos complementan a la analítica de datos de redes al impulsar la confianza en los activos informacionales, algo que se consigue mediante la definición de políticas que protejan los datos sensibles, la gestión del acceso a la información, el seguimiento del linaje de datos, la aplicación de los principios reguladores y el empoderamiento usuario.

¿Sabe su organización sacar todo el partido a la analítica de datos de redes? ¿Se lleva a cabo el adecuado trabajo de preparación antes de analytics? ¿Los esfuerzos en materia de gestión de datos posteriores a la generación de conocimiento están canalizados en la dirección correcta?