Objetivo general
Desarrollar un sistema que, además de realizar los distintos pasos del proceso de descubrimiento de conocimiento, pueda ser utilizado para explicar y comprender cómo se llevan a cabo los procesos.
Objetivos especificos
- Implementar un módulo de entrada de datos, que consiste en la lectura, guardado y modificación de conjuntos de datos.
- Implementar un módulo de análisis estadístico que permita realizar análisis univariable y bivariable sobre el conjunto de datos cargado en el sistema.
- Implementar un módulo de limpieza de datos para poder detectar y corregir distintos factores que podrían generar ruido en el proceso de minería de datos.
- Dentro del módulo de limpieza se detectarán: valores faltantes, valores
- erróneos (outliers) o errores tipográficos.
- Realizar muestreo de datos y transformación de datos por atributo.
- Implementar los algoritmos de clasificación: ZeroR, OneR y Naïve Bayes.
- Implementar el algoritmo de agrupamiento (clustering): K-Means.
- Desarrollar una interfaz gráfica de usuario que sea intuitiva.
- Implementar una opción que desglose paso a paso cómo realizar los procesos más relevantes de la minería de datos. (Algoritmos y procesos estadísticos).