<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=1500086133623123&amp;ev=PageView&amp;noscript=1">

La minería de datos directa e indirecta en el BI de nueva generación

Publicado el 25/12/15 8:00

Por definición, y como sabemos, el data mining o minería de datos es el proceso de extracción de información desconocida de antemano, no banal y no trivial contenida implícitamente en los datos.

Para extraer datos sensibles de las fuentes y las data warehouses se emplean distintos tipos de algoritmos permitiendo, en algunos casos, automatizar el proceso de extracción determinando ciertas variables como objetivos y, en otros, llevarlo a cabo sin describir objetivos con el fin de reconocer patrones existentes o detectar relaciones relevantes entre otros tipos de variables. Es lo que se conoce, respectivamente, por minería de datos directa (o MDD) e indirecta (MDI).

minera_de_datos-1

 Descubre los mitos alrededor del concepto de Big Data

La minería de datos en la analítica predictiva

La minería de datos directa persigue unos fines muy concretos y diferenciados de la minería indirecta. Entre otras, las metas de la MDD consisten principalmente en:

 

  • Clasificar y ordenar los datos.

  • Evaluar su relevancia.

  • En la analítica predictiva, evidentemente predecir el comportamiento o el desempeño futuro de procesos, actividades y operaciones relacionadas con esos mismos datos.

 

Es frecuente, sin embargo, que tras el proceso de extracción los datos obtenidos sean insuficientes o de escasa calidad (garantizar la calidad de los datos, especialmente tras la irrupción de fuentes como las redes sociales, es una de las principales prioridades corporativas en lo que a gobernanza y gestión de la información se refiere). Por ello, para ampliar el espectro de posibilidades, es preciso emplear técnicas de minería indirecta que, entre otras cuestiones, permite descubrir relaciones ocultas entre datos y patrones no visibilizados hasta el momento.

El enfoque indirecto de la minería de datos, al no destacar ninguna variable como objetivo, tiene como fin establecer nuevos conglomerados de datos e identificar reglas de asociación ocultas, así como describirlas y visualizarlas para poder aplicarlas en nuevos procesos de extracción directa. No obstante, en este caso y como es de suponer, los límites de las herramientas tradicionales estribaban en el manejo de los ingentes volúmenes de datos a los que actualmente se tiene acceso.

Resumiendo, la aplicación de la minería de datos en un entorno BI tradicional, ya fuese mediante un enfoque directo o indirecto, si bien permitía obtener más información que la ofrecida por la analítica convencional, también presentaba serias limitaciones, principalmente (como hemos comentado) en lo que concierne a la calidad de los datos manejados y el tratamiento de los nuevos volúmenes de datos, especialmente elevados a tenor del constante surgimiento y evolución de fuentes de datos cada vez más amplias y complejas.

La analítica avanzada ofrece una respuesta óptima a los retos planteados por la exigencia de mayor calidad de datos y el surgimiento de un nuevo Big Data (mayor volumen, variedad y velocidad), superando las arquitecturas tradicionales del BI con nuevos métodos y herramientas capaces de brindar soluciones ajustadas y a la altura de las necesidades analíticas corporativas de nuevo orden. Un BI de nueva generación que toma la minería de datos como una de sus puntas de lanza más destacadas, con la vista puesta en el análisis predictivo y ofreciendo un apoyo prescriptivo a la toma de decisiones. Sobre estos y otros asuntos de interés, claves para conocer con más detalle en qué consiste la inteligencia de negocios de nueva generación, versa la guía Optimización de los entornos analíticos con Big Data, un recurso que incluye casos de estudio y que se halla disponible, completamente gratis, en el apartado de publicaciones y estudios de este mismo blog.

 

Post relacionados:

 

Recursos sobre Business Intelligence y Gestión de la Información