Los datos tienen solo valor potencial, es su análisis y sistematización el que permite incrementar la capacidad de innovar y obtener ventajas en las organizaciones. La calidad de los datos es una característica esencial que determina la fiabilidad de los análisis para la toma de decisiones.
Datos de calidad nos llevarán a desarrollar análisis de calidad. Lamentablemente, los datos reales pueden ser impuros y conducir a la extracción de patrones o reglas poco útiles. Datos malos nos llevarán a la mala toma de decisiones. El preprocesamiento de datos es un paso preliminar durante el proceso de ciencia de datos. Es importante para poder sacar el mejor provecho a los datos provenientes de diversas fuentes y que son susceptibles de análisis.
El Curso Preprocesamiento y análisis exploratorio de datos busca introducir a los participantes en técnicas de preprocesamiento y análisis exploratorio de datos como paso previo al desarrollo de modelos de Machine Learning.