Les fichiers csv dont le nom est "liste..." contiennent les bases de données brutes. Les fichiers csv dont le nom est "table..." contiennent les bases de données nettoyées et augmentées avec de nouvelles variables d'intérêt.
Dans l'ordre, les fichiers contenant du code sont :
- Le fichier "Webscrapp sans recup nom" qui permet de scrapper les bases sur internet
- Le fichier "prep donnee" qui nettoie et augmente les bases
- Le fichier "analyse nan" analyse les données manquantes et le problème de certaines données incohérentes
- Le fichier "statistique_descriptives_deputes" contient le travail de statistiques descriptives
- Le fichier "clustering" contient la partie modélisation basée sur le modèle k-means