<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1500086133623123&amp;ev=PageView&amp;noscript=1">

El data mining y la importancia de la visualización de datos

Publicado el 31/10/14 8:00

La minería de datos, o data mining, es un proceso de identificación de información relevante extraída de grandes volúmenes de datos, con el objetivo de descubrir patrones y tendencias estructurando la información obtenida de un modo comprensible para su posterior utilización.

Atendiendo a estos objetivos, no es difícil entrever de qué modo y en qué sentido las herramientas de visualización de datos son necesariamente complementarias al proceso de minería de datos, y en qué momento entran e juego para que la información detectada como relevante pueda ser leída y comprendida de un modo inmediato, sencillo y efectivo.

 

spl048389

  

La visualización de datos en el data mining

Como todo proceso, la minería de datos también se lleva a cabo en distintas fases, y como sucede en la minería tradicional, también existen varias técnicas de extracción (en nuestro caso, para extraer esa información considerada relevante para el negocio y mostrarla de un modo comprensible).

Los pasos que incluye cualquier proceso de data mining empiezan con una selección de los datos a tratar en función de variables de predicción y cálculo, es decir, de un conjunto de variables objetivas y otro de variables independientes: las primeras son las que guían la elección en función de los objetivos que se persiguen con el análisis, y las segundas determinan de qué modo se llevará a cabo el proceso.

Tras ello, se analizan las propiedades del conjunto de datos seleccionados para detectar patrones, tendencias, valores atípicos y datos descartables con nulo valor informacional. Este análisis previo guiará el posterior procesamiento de los datos, que permitirá clasificarlos y segmentarlos en función del modelo predictivo elegido, y tras lo cual se elaborarán modelos de conocimiento gracias a la identificación de patrones de comportamiento, y de elementos de asociación y disociación entre las distintas variables usadas en el análisis previo.

Descarga la versión de prueba de Tableau Desktop y descubre la plataforma de  autoservicio más solicitada

Finalmente, una vez obtenido el o los modelos de conocimiento mediante el uso de las distintas técnicas aplicables, se procede a la validación de los mismos tras compararlos e interpretarlos, y a la elección del más satisfactorio según los resultados obtenidos. Si ningún modelo satisface las expectativas de conocimiento esperadas, el proceso se repite de nuevo cambiando variables y adoptando técnicas distintas a las usadas en los procesos anteriores, hasta obtener un modelo la explotación del cual satisfaga las necesidades de conocimiento corporativo expresadas.

La visualización de datos y, en concreto, el uso de las herramientas que cumplen este cometido es fundamental para agilizar el proceso y ahorrar tiempo y esfuerzos a los expertos que deben determinar, con la máxima rapidez y eficiencia, si los modelos obtenidos se ajustan con lo esperado. En esa comparativa entre modelos y su evaluación para determinar si son lo suficientemente satisfactorios es donde entran en juego las herramientas de visualización de datos, que simplifican y agilizan la tarea de los expertos permitiendo optimizar el proceso del data mining, reduciendo el tiempo empleado para llevarlo a cabo y minimizando los riesgos asociados a una mala interpretación de los resultados obtenidos.

No cabe duda que el data mining y, por consiguiente, la visualización de datos están íntimamente relacionados con una correcta gestión de los datos y la información. No olvidemos que los datos representan uno de los valores principales de cualquier organización y que, por lo tanto, su correcta administración es de gran importancia el devenir corporativo. La guía 10 claves para definir tu estrategia corporativa de gestión de datos, disponible gratuitamente en nuestro apartado de recursos Business Intelligence, expone las principales claves para el éxito de cualquier proyecto de gestión de datos corporativos, por lo que resulta un recurso fundamental y altamente recomendable para todo aquél que desee profundizar en una cuestión de tan vital importancia para todo tipo de negocio.

 

Post relacionados:

 

Recursos sobre Business Intelligence y Gestión de la Información