Las empresas fluyen, adaptándose lo más rápido que les es posible a este entorno de Big Data, que multiplica el volumen de datos que se adquieren, reduce los tiempos de respuesta esperados y convierte el procesamiento de datos en una de las claves de BI actual. En este medio tan heterogéneo, donde confluyen los datos históricos de la empresa, con registros en tiempo real e información proveniente de las redes sociales; la estandarización es indispensable.
Hablar de estandarización en lo referente a una migración de datos supone ahondar en el conocimiento del dato, desde la óptica de la lógica y minimizando su parte abstracta para facilitar su traslado en condiciones de control.
Créditos fotográficos: "Quality Button Represents Excellent Service Or Products" by Stuart Miles
La estandarización de datos
La estandarización de los datos no obedece a una sola razón, sino que viene motivada por distintas necesidades que responden a planteamientos que aparecerán a lo largo de todo el proceso de migración de datos. Estandarizar implica asegurar, en base a los resultados obtenidos en la fase de investigación, que se han alcanzado las condiciones óptimas en cuanto a:
-
Incorporación de un lenguaje altamente flexible de reconocimiento de patrones.
-
Estandarización por dominio específico: por ejemplo, uso de reglas específicas para nombres y apellidos, direcciones o fechas.
-
División de los datos por su naturaleza: como nombre y apellidos, tipo de vía, nombre de calle y número.
-
Normalización de la escritura de los datos: como, por ejemplo, Pepe=José o Glez.=González.
-
Parametrización de tablas de clasificación y estandarización.