Blog de Analytics

Análisis de opiniones y minería de datos: retos y amenazas

Escrito por Logicalis | 9/06/16 6:00

La minería de datos enfocada al análisis de opiniones ha ganado importancia, dado lo habitual de la costumbre de compartir puntos de vista online, que no sólo ha aumentado en volumen sino que sirve, cada vez más, como referencia para quienes están valorando la posibilidad de adquirir un producto o contratar un servicio. En internet, la gente da puntos de vista sobre casi todo, de restaurantes a destinos de vacaciones, de software a abogados y los medios sociales han jugado un papel vital en la proliferación de esta sabiduría popular. 

Créditos fotográficos: istock maxuser

Este tipo de plataformas facilitan que los diferentes consumidores y usuarios puedan compartir sus opiniones y puntos de vista sobre un tema determinado en cualquier momento y lugar. El alcance de cada opinión vertida en el social media y su accesibilidad, tanto para los autores de los mensajes de valoración, como para quienes los consultan antes de tomar decisiones, tiene un impacto en los negocios que no debe pasar inadvertido ni dejarse fuera de control.

Pero en el camino de las empresas para lograr el conocimiento que la minería de datos les brinda, habrán de superar muchos retos, algunos más fáciles de resolver, como la diversidad de plataformas o el uso de lenguaje informal; y otros más complejos, como el spam de opiniones, que afecta a muchos negocios.

 

 

Minería de datos para conocer a los clientes: de los retos a la estrategia

Hoy día, las empresas aplican técnicas de minería de datos a las redes sociales para detectar y establecer nuevas tendencias, buscar oportunidades de negocio o comprobar la eficacia de sus estrategias de marketing. Sin embargo, la minería de opiniones se ha convertido en una tarea más difícil de llevar a cabo debido a distintos motivos, entre los que cabría destacar los cinco siguientes:

  1. Diversidad de datos en relación a opiniones sobre cada producto o servicio.
  2. Variedad de plataformas donde las valoraciones de los usuarios son vertidas.
  3. Presencia de spam u opiniones falsas que, en vez de ser subidas a la red por consumidores, tienen como autores a los principales competidores, que buscan reducir el índice de popularidad de un artículo, un servicio o una compañía rival.
  4. Uso de lenguaje informal o argot, algo bastante habitual en los lugares de internet donde las opiniones se suelen difundir, como son los blogs, foros o redes sociales.
  5. Incorporación de emoticonos entre el texto para describir mejor los sentimientos que surgen ante determinada circunstancia, bien o servicio.

Cuando se consiguen superar estos retos, se abre un nuevo desafío: emplear la información obtenida para conocer mejor al cliente.

La gente utiliza distintos medios sociales con propósitos diversos y, por eso, la información recogida de cada uno de ellos es a menudo parcial, por lo que nunca resulta suficiente para conocer al cliente. Cuando se integran fuentes de información complementaria, es posible construir un perfil de un usuario más completo y fiable que puede ayudar a mejorar los servicios en línea y afinar la precisión de la publicidad en los sitios web; pero, para integrar estas fuentes de información, es necesario identificar a los individuos a través del social media, algo que no resulta fácil.

Para abordar el problema de la identificación del usuario en distintos medios resulta eficaz explotar las redundancias de información que pueden surgir y el comportamiento del usuario específico, como la migración a través de sitios de medios sociales. A partir de ahí, la minería de datos y el análisis entran en juego, abriendo al negocio posibilidades como:

  • Creación de nuevos servicios en línea.
  • Recomendaciones online.
  • Publicidad al usuario y sus contactos.

 

Minería de datos: cuidado con el spam en las opiniones

Amazon llevó a juicio a más de 1000 autores de opiniones falsas a finales del pasado año, tal y como informa The Guardian. Emprender acciones legales contra estos individuos es uno de los medios del gigante del retail para tratar de frenar una costumbre que afecta tanto a productores, como a distribuidores y a usuarios.

Otra de las herramientas a su alcance para evitar las opiniones falsas, detectándolas a tiempo, es la minería de datos. Esta disciplina utiliza los datos ya existentes (opiniones) en diferentes bases de datos (de redes sociales) para transformarlo en nuevas investigaciones y resultados (conocimiento empresarial, inteligencia de negocio). Para ello:

  • Se apoya en la inteligencia artificial, aprendizaje automático y gestión de bases de datos para extraer nuevos patrones de grandes conjuntos de datos y los conocimientos asociados a estos patrones.
  • Extrae los datos que la organización necesita a través de medios automáticos o semi-automáticos.
  • Los diferentes parámetros incluidos en la extracción de datos incluyen la agrupación, el pronósticos, el análisis de rutas y el análisis predictivo, entre otros.

En la práctica, la minería de datos enfocada al análisis de opiniones toma los comentarios lanzados por diferentes personas sobre un determinado producto y, para analizar su fiabilidad, necesita desarrollar un modelo matemático que permita buscar en los datos históricos de cada componente y en los nuevos datos recogidos, identificando la dirección IP.

Las valoraciones falsas creadas por los competidores y el público en general podrán ser detectadas, con la ayuda de las técnicas adecuadas y la labor de un especialista en big data, mediante la búsqueda de la dirección IP de cada uno de los comentarios negativos y en base a múltiples cálculos de umbral de los parámetros ya dados, cruzados con los resultados obtenidos a partir de la plataforma pública en los medios sociales.

Dado que las opiniones de los usuarios online tienen el potencial real de influir en el éxito o el fracaso de un producto, al detectarse las que son falsas se deberán tomar acciones inmediatas, por ejemplo empezando por bloquear el acceso a la web de ese usuario o informar al responsable del sitio de que se está haciendo un uso fraudulento de la libertad de opinión, que también puede terminar afectando negativamente la imagen de la web donde se recogen estos comentarios.