En un entorno como el actual, caracterizado por una generación de datos con un volumen, una variedad y una velocidad crecientes a ritmo exponencial, es necesario dotarse de tecnologías, herramientas y procesos capaces de afrontar con éxito los retos que estas condiciones plantean para los negocios y las actividades empresariales.
Es en este contexto en el que surge el datamining (o minería de datos), un proceso que facilita la comprensión de los datos brutos almacenados en las data warehouse corporativas, con el objetivo de detectar su relevancia y significación en el aporte de información útil para la organización, la cual posteriormente será transformada en conocimiento y apoyo a la toma de decisiones.
Las claves del datamining
Cuando hablamos de datamining, normalmente nos referimos a él como proceso; sin embargo, es importante notar hasta qué punto esta consideración es extremadamente simplista y limitante. En realidad, con esta denominación designamos un conjunto complejo de procesos que integra distintas áreas y que se llevan a cabo en varias etapas, cada una de las cuales requiere unas herramientas específicas.
Pese a cumplir con el objetivo principal que hemos mencionado al iniciar este breve repaso (esto es, comprender datos en bruto con el objeto último de proporcionar conocimiento y apoyo a la toma de decisiones), cualquier proyecto de minería de datos debe emprenderse desde el estamento superior de la pirámide que representa la relación entre datos y conocimiento, siendo los primeros su base —con una amplitud, una variedad y un volumen en constante crecimiento—, ocupando la información un estamento intermedio y la obtención de conocimiento su zenit, su punto álgido.
Desde esa cumbre, desde la perspectiva amplia e integral que abre las puertas al conocimiento es el punto desde el que se debe emprender un proyecto de minería de datos; solo así, con su cometido concretado en unas necesidades de conocimiento específico, se puede discernir entre los datos relevantes para la detección de patrones y tendencias que generan modelos de comportamiento, de los datos sin ninguna relevancia o descartables por su escasa calidad.
Clarificar un propósito al que someter los procesos implicados en la minería de datos es, pues, la clave principal que determinará el éxito o el fracaso de todo proyecto analítico. Al igual que buscar algo sin saber qué «algo» se espera, se desea o se necesita encontrar, emprender un proyecto de datamining sin tener suficientemente clarificados y concretados los propósitos a los que servirá carece completamente de sentido.
Esto, evidentemente, obliga a adoptar una estrategia corporativa de análisis de datos que permita dilucidar con la suficiente claridad los objetivos a perseguir con un proyecto de minería de datos, un asunto crucial que herramientas como la guía 10 claves para definir tu estrategia corporativa de gestión de la información, completamente gratuita, expone con la necesaria amplitud y exhaustividad. Un instrumento formativo al que añadir, como complemento indispensable, otros recursos afines —como el ebook (también gratuito) El proceso y los retos para obtener datos fiables para tu analytics, con información imprescindible para identificar la fiabilidad de los datos y tomar las medidas necesarias para asegurar una calidad óptima de los mismos, entre otras cuestiones de importancia.
Post relacionados:
-
Primeros pasos del Centro de Excelencia Big Data en Barcelona
-
Avances en visualización de datos para la investigación científica