Primitivas de funciones de transformación de un ETL para una implementación BI en QLIIKVIEW
Autor
Urra Valenzuela, Jonathan
Profesor Guía
Urrutia Sepúlveda, AngélicaFecha
2013Resumen
La información ha tomado gran relevancia en las organizaciones actualmente, siendo los
datos que se encuentran en las bases de datos OLTP quienes posean todo el conocimiento
necesario para poder realizar un análisis óptimo que permita una buena toma de decisiones
en una empresa. Aunque no todos los datos en las fuentes OLTP son fiables, debido a que
normalmente vienen con caracteres no válidos, errores de formato, datos inconsistentes.
Entonces, esto puede llevar a que los análisis realizados, lleven a conclusiones erróneas y a
tomar malas decisiones.
Debido a estos problemas de inconsistencia de información es de suma importancia que los
datos que sean cargados al Almacén de Datos, sean de calidad y no cargar datos cuya
información pueda llevar a decisiones erróneas. En una herramienta BI es de suma
importancia el proceso de ETL, debido a que es en esta etapa donde se realiza el proceso de
limpieza y transformación de los datos para que estos puedan ser moldeados para la carga,
de tal manera, que las decisiones tomadas con esta información, sea lo más cercano a una
decisión acertada.
La herramienta BI QlikView ofrece un análisis de clase empresarial con la simplicidad,
rapidez y facilidad de uso en comparación con las demás herramientas que están en el
mercado. Además de poseer un ETL extremadamente robusto y completo, que tiene la
capacidad de realizar extracciones y cargas de distintas fuentes de datos, y además posee
un alto repositorio de funciones las cuales se utilizan para realizar el proceso de
transformación de los datos.
Dada la importancia de esta herramienta BI, y para abordar el problema de la calidad de
datos en sus fuentes de origen, es que se decidió buscar la manera de catalogar una serie de
reglas, las cuales con las funciones entregadas el ETL de QlikView, que se propone sean
usadas por el diseñador para moldear los datos para entregar datos confiables y que
entreguen información para tomar decisiones lo más acertadas posibles.
La metodología utilizada en esta investigación de memoria, comienza con la evaluación de
la problemática expuesta, seguida de una exhaustiva revisión de funciones que tiene el ETL
de QlikView en su repositorio, realizando asociaciones entre estas por el tipo, la utilidad, y
las transformaciones que realizan. Con las funciones ya organizadas, se agrupan
dependiendo las transformaciones que pueden realizar, para así con estas realizar una
propuesta de regla o primitiva de esta. Luego para realizar la muestra de las primitivas se
utilizó como base la arquitectura propuesta por Adriana Marotta en ““Diseño de Data
Warehouses: Un enfoque basado en transformación de esquemas” [MAR1999]. Ya una vez
finalizado el proceso de generación de las primitivas, se agrupan todas las funciones en
cada caso, se realizan muestras de casos específicos para el mejor entendimiento de su
funcionamiento.
Finalmente como conclusiones se estimó que seleccionar algún método para limpieza y
transformación de datos para un ETL específico no es fácil, puesto que se deben analizar
las diferentes variables que posee la herramienta para ver cuáles son los límites los cuales
esta herramienta puede abordar o cuales están fuera del alcance de esta herramienta.
Tesis para optar al título de Ingeniero de Ejecución en Computación e Informática
Link de Acceso
Click aquí para ver el documentoLa publicación tiene asociados los siguientes ficheros de licencia: