Blog de Analytics

Open data: 3 pistas para seleccionar con criterio

Escrito por Logicalis | 6/01/16 7:00

Junto con el internet de las cosas, open data es cada vez más valioso para analytics. La buena noticia es que no sólo su valor ha aumentado, sino que también se ha extendido su accesibilidad. Open data es la semilla de futuro para las organizaciones de hoy día que saben cómo aprovechar sus beneficios. Motivaciones no han de faltar, como confirman los siguientes datos, compartidos desde la web de la Open Data International Conference 4ª edición (que se celebrará en Madrid, en octubre de este año):

Créditos fotográficos: istock yuuurin

  • Potencial. Tras producirse el terremoto de Nepal en mayo del pasado año, 4.000 voluntarios asignaron 20.000 km de carretera en 48 horas en Katmandú. Lo lograron gracias a OpenStreetMap, una plataforma open data de mapeo global en línea.
  • Ajuste. El Reino Unido es uno de los países que ya emplean los datos sobre las tasas de mortalidad para medir y planificar la preparación de los servicios hospitalarios.
  • Alcance. La web opencorporates comparte información sobre empresas. Su volumen de datos ha crecido de tal forma que hoy día es posible acceder a información sobre cincuenta y cinco millones de empresas de todo el mundo.

 

 

 

Cómo aprovechar las ventajas de open data

Los beneficios de open data son evidentes pero para organizaciones, tanto del sector público como del privado, queda superar un importante desafío, el seleccionar las mejores fuentes de información para su toma de decisiones.

En primer lugar, esta selección ha de tener en cuenta tres criterios:

1. Actividad: el nivel de actividad de la fuente open data constituye una pista importante para conocer su nivel de actualización. Si un proyecto open data se ha abandonado, es probable que no todos los datos allí contenidos sean útiles para el negocio y su uso puede conllevar riesgos que es mejor evitar.

2. Relevancia: existen cada vez más opciones open data, pero no todas son igual e interesantes para la toma de acción. Es preciso hacer una buena selección antes de perder el tiempo (y malgastar recursos) procesando y analizando información que no generará valor.

3. Formato: hay que pensar en el hoy pero sin olvidarse del mañana. Los formatos numéricos son compatibles con el machine learning, por lo que, dependiendo del tipo de negocio y sus metas, puede ser más conveniente centrar la búsqueda en fuentes open data que aporten este tipo de datos que en otros de los que sólo pueda extraerse información más vaga y genérica, que limitará sus posibilidades de uso.

Cando la selección de las fuentes open data que se emplearán para el análisis predictivo se da por concluida, hay que pasar a la siguiente fase. Es el momento de controlar los datos procedentes de estas fuentes para:

  • Detectar errores.
  • Validar la fiabilidad de la fuente.
  • Determinar si mantienen su relevancia.

En esta etapa es fundamental contar con el compromiso de los usuarios de negocio que, al fin y al cabo, son quienes entran en contacto con los datos de forma más directa. Open data puede abrir muchas puertas a la organización y es tarea de todos velar porque se consiga en las mejores condiciones posibles.

 

Post relacionados: