El data mining o minería de datos, de la que nos hemos ocupado en otras ocasiones, es un proceso que permite comprender los datos almacenados en las bases y almacenes corporativos antes de pasarles el cepillo, es decir, en estado bruto, con el fin de detectar cuáles cumplirán mejor su misión a la hora de aportar información relevante para la organización y que generen el conocimiento adecuado para apoyar la correcta toma de decisiones.
En los procesos de minería de datos convergen distintas áreas y aplicaciones, todas ellas unidas en el propósito de detectar los datos más relevantes y extraer conocimiento sensible de las data warehouse corporativas. Por ello, sus aplicaciones pueden ser tan distintas como tipos y modelos de negocio puedan requerir de un proceso de esta índole, aplicaciones que en los últimos tiempos se han visto enormemente ampliadas a tenor de la expansión de las herramientas Business Intelligence más allá de los límites de las actividades empresariales. Entre ellas destaca la minería web, una aplicación transversal que interesa a todo tipo de organizaciones, especialmente a las que apoyan sus actividades fundamentalmente en el ámbito de las redes e Internet.
Es indudable que las actividades online son fuentes inagotables de datos, con una importancia muy superior a otras fuentes de origen en lo que a cantidad y variedad de datos se refiere (y, por supuesto, en lo que concierne a la velocidad con la que se generan). A medida que las TIC siguen desarrollándose y abriendo nuevos canales, descubriendo nuevas aplicaciones y apostando por nuevas soluciones basadas en la web, crece en la misma proporción la necesidad de contar con sistemas y procesos que garanticen una gestión adecuada de los datos contenidos en las data warehouse corporativas; pruebas de ello son los avances en tecnologías como el Internet de las cosas, o la proliferación de redes sociales aptas para llevar a cabo actividades de negocio.
Pero no nos hace falta ir tan lejos para presentar una de las extensiones con una aplicación más universal en el ámbito de los negocios, la minería web, que solo en el espacio estricto y tradicional de la world wide web ya encuentra suficientes motivos para devenir un asunto especialmente clave y relevante.
Los datos recabados a través de una web, de un blog o un portal cualesquiera incluyen direcciones IP, cookies de todo tipo, información sobre búsquedas, consultas y preferencias de navegación, software utilizado... es decir, un universo prácticamente infinito de posibilidades que requieren un tratamiento adecuado para extraer, de ellas, el conocimiento necesario para apoyar la toma de decisiones que afecte, directa o indirectamente, a las actividades que se lleven a cabo en el espacio web (además de aquellas que determinen el curso global de la estrategia corporativa, por supuesto).
El contenido, el uso y la estructura, con el fin inmediato de detectar cuáles de entre todos los posibles contenidos, usos y estructuras son mejor percibidos y acogidos por parte del público objetivo.
Dicho esto, no debemos confundir la minería de datos con otros procesos asociados a lo que se conoce como Big Data Analytics (sobre la cuestión, podemos encontrar amplia información en la guía gratuita El proceso y los retos de obtener datos fiables para la analítica de negocio); la minería de datos cumple, como hemos comentado, una función muy concreta: detectar patrones y regularidades en los datos contenidos en una data warehouse, con el fin de caracterizarla y disponerla adecuadamente para una correcta aplicación de las herramientas de análisis de datos. Un proceso que, aplicado a ámbitos como el web (y como se ha apuntado aquí) posee un interés universal, transversal e inapelable para organizaciones y compañías de cualquier sector que confíen en la red de redes para llevar a cabo sus actividades de negocio.