Proyecto destinado a la predicción del ingreso anual en USD, el objetivo es clasificar si el ingreso de un individuo superará el umbral de $50K.
A partir del dataset Adult Income se realizaron una serie de transformaciones para obtener un conjunto de datos util. La base de datos resultante se utilizo para entrenar diferentes modelos de clasificación así como para identificar patrones e insights.
La base de datos en crudo cuenta con los campos:
A partir del conjunto de datos anterior se realizaron las actividades:
- Adquisición y comprensión de datos
- Limpieza y preparación de los datos
- Analisis exploratorio
- Preprocesamiento de los datos
- Modelado
En este trabajo se usó un modelo Random Forest.
Bajo el framework Streamlit