Extracción de datos basados en clustering para la gestión de la información en una minería de datos
Autor
Arce Lillo, Paul
Urrutia Gajardo, Felipe
Profesor Guía
Urrutia Sepúlveda, AngélicaFecha
2006Resumen
Este documento presenta una investigación acerca de tecnologías para poder llevar a cabo algoritmos para la gestión de la información, específicamente algoritmos de clustering, basados en una plataforma de Base de Datos MySql con una arquitectura cliente-servidor Web.
Se define una arquitectura propia, usando como base la de un Data Warehouse, la cual a una data con N-tablas se le aplica un select bajo ciertos criterios, almacenando los resultados en una tabla temporal, la cual se traspasa a un arreglo bidimensional, una vez que los datos se encuentran en el arreglo se le aplica el algoritmo en cuestión. El algoritmo seleccionado es el K-means y fue escogido porque permite trabajar con datos numéricos y a la vez da la facilidad de seleccionar el número de clústeres con anterioridad. Bajo el criterio de la arquitectura implementada el desarrollo de algoritmos se sustenta sobre una plataforma ASP, programando en VBscript para las aplicaciones que se ejecutan en el servidor y Javascript para las que se ejecuten en el cliente, este último más que nada para las validaciones de estos algoritmos.
El estudio muestra información de los resultados obtenidos a través del algoritmo de clustering en una página Web, esta tiene la opción de ver en detalle lo que se requiera, para que finalmente se puedan tomar decisiones y gestionar la información de manera adecuada
No esta de más decir que esta información tiene que ser precisa, en el tiempo correcto (oportuna), mostrarla en la forma adecuada (gráficos, cuadro resumen, etc.) y consistente.
Tesis para optar al título de Ingeniero de Ejecución en Computación e Informática
Link de Acceso
Click aquí para ver el documentoLa publicación tiene asociados los siguientes ficheros de licencia: