La minería de datos es capaz de informar sobre eventos importantes hasta el momento desconocidos, permitiendo realizar pronósticos fiables, que hacen posible tomar acción en condiciones de riesgo mínimas. La técnica que se utiliza para llevar a cabo estas hazañas se denomina modelado. Los modelos de data mining se originan, ya sea como un conjunto de ejemplos o como una relación matemática, en base a los datos de situaciones sobre las que se conoce la respuesta, primer paso para luego aplicar el modelo a otros eventos donde existen cuestiones por resolver.
Las técnicas de modelado no son de nueva aparición, sino que han estado disponibles durante décadas, aunque sólo recientemente se ha logrado alcanzar la capacidad de almacenamiento de datos y de comunicación necesarios para recoger y guardar grandes volúmenes informacionales. A ellos hay que añadir la potencia de cálculo necesaria para automatizar las técnicas de modelado, que permite trabajar directamente sobre los datos.
La creación de modelos de data mining aplicada a los negocios permite:
-
Extraer conocimiento de los datos.
-
Exprimir todo el valor que encierra ese conocimiento.
-
Perfeccionar la estrategia empresarial.
Ejemplo de ello sería un modelo que defina a un grupo específico de clientes, los mejores, los que más consumen y además lo hacen con más frecuencia. Para construir este data mining model sería necesario conocer mejor a los clientes y para ello habría que acudir a la base de datos, profundizando en la información que se tiene de cada uno (edad, sexo, ocupación, código postal, ingresos... todos los datos disponibles).
El análisis de estos datos se completaría con un estudio que permita identificar características comunes de los clientes objetivo. De esta forma, se habría detectado un segmento, un modelo de clientes de alto valor sobre los que trabajar de muchas formas; entre ellas:
-
Ofreciendo promociones personalizadas.
-
Diseñando campañas de marketing específicas.
-
Aplicando técnicas de retención.
Créditos fotográficos: istock vaenma
Lo que hay detrás de los modelos de data mining
Los sistemas analíticos utilizados en la minería de datos son algoritmos y técnicas matemáticas, estadísticas y probabilísticas ya existentes y ampliamente conocidas. Lo novedoso de su uso es su aplicación a los problemas empresariales generales, que es posible gracias a la mayor disponibilidad de datos y a la disminución de costes tanto de almacenamiento como de procesamiento.
En el preludio a la creación de modelos de data mining, algunas de las herramientas utilizadas son:
-
Redes neuronales artificiales: se trata de modelos predictivos no lineales que aprenden a través de la formación y se asemejan, estructuralmente hablando, a las redes neuronales biológicas.
-
Árboles de decisión: son conjuntos de decisiones, que generan reglas para la clasificación de un conjunto de datos, configurándose para ello en base a estructuras en forma de árbol.
-
Reglas de inducción: en base a cálculos estadísticos es posible generar reglas útiles que siguen un patrón de si - entonces y pueden aplicarse a los datos a analizar para extraer conclusiones y hacer pronósticos.
-
Algoritmos genéticos: esta herramienta, bastante utilizada para obtener modelos de data mining consiste en la aplicación de técnicas de optimización basadas en los conceptos de la combinación genética, la mutación y la selección natural.
Post relacionados: