El data warehouse juega un papel muy importante cuando se trata de asegurar la calidad de la información para analytics. La analítica avanzada, en sus modalidades predictiva y prescriptiva, permite llegar muy lejos al negocio, al alcanzar un grado de conocimiento que no puede lograrse de ninguna otra forma y lograr impulsar su optimización minimizando el riesgo; sin embargo, los atributos de la calidad del dato deben quedar garantizados. Someter el data warehouse a pruebas es la forma más efectiva de conseguirlo.
Créditos fotográficos: istock Mike_Kiev
Existen distintos tipos de test que pueden aplicarse al data warehouse y bases de datos cuando se quiere garantizar que los procesos de predictive analytics se conducen en términos de calidad total. algunas de las más interesantes son:
1. Pruebas unitarias: consisten en validar cada uno de los componentes de una solución, aunque este tipo de test ha de llevarse a cabo durante la etapa de desarrollo, nunca después. Los elementos más críticos y que deben someterse a este tipo de prueba son, al menos, la lógica ETL, reglas de negocio y cálculos implementados en la capa de OLAP y la lógica de KPI. Este tipo de pruebas se realiza en varias ocasiones a lo largo del curso de un proyecto y puede automatizarse.
2. Pruebas del sistema de integración: depende del éxito obtenido en las pruebas unitarias y debe lograr dos metas principales:
a. Garantizar que se puede construir y desplegar con éxito: para lo que es necesario realizar pruebas de acumulación del sistema
b. Asegurar que no surgen problemas durante la ejecución del trabajo: con este objetivo, una vez implementados y configurados, todos los trabajos deben ser ejecutados y los datos procesados.
La adopción de este tipo de pruebas en el ciclo de desarrollo del data warehouse y bases de datos es un paso gigante hacia adelante, que sirve para confirmar que el sistema actúa del modo esperado una vez que las partes constituyentes de la solución se ponen juntas.
3. Pruebas de validación de datos: mediante este proceso se someten a test los datos dentro de un data warehouse. Una forma habitual de realizar esta prueba es mediante el uso de una herramienta de consulta ad hoc (Excel) que permita recuperar datos en un formato similar a los informes operativos existentes. Cuando se detecta la existencia de un vínculo entre el data warehouse y el informe operacional, se demuestra que los datos son válidos (a menos que, por supuesto, el informe original sea defectuoso). Esta prueba ha de ser llevada a cabo por un representante del negocio, ya que este perfil es quien mejor conoce los datos y puede validarlos con mayores garantías de éxito.
4. Pruebas de aceptación de usuario: su objetivo es asegurar que los datos que se proporcionan al usuario final cumplen con sus expectativas y que lo mismo sucede con las herramientas que se ponen a su disposición.
5. Pruebas de rendimiento: se ocupan de validar adecuadamente el rendimiento de la solución en condiciones de trabajo reales. Para ello, en el testing hay que considerar factores como la arquitectura de datos, la configuración del hardware, la escalabilidad del sistema o la complejidad de las consultas.
6. Pruebas de regresión: este tipo de test es el proceso de volver a probar la funcionalidad para garantizar que el desarrollo del data warehouse y bases de datos no ha causado desperfectos en otras funcionalidades y aplicaciones. Cada una de las distintas categorías de pruebas definidas anteriormente debe quedar sujeta a pruebas de regresión.
Post relacionados: