Les instructions portant sur le projet suivront.
Nous voulons déterminer sur quel site web il faudrait acheter les parfums des marques Nina Ricci et Dior. Les sites web parmi lesquels il s'agit de choisir sont ceux de Sephora, Marionnaud et Nocibé.
La réalisation de ce projet vous conduira à effectuer les tâches suivantes :
- Concevoir une application web
- Scraper des données
- Explorer la structure d'un site web (HTML)
- Simuler une navigation (selenium)
- Stocker les résultats du scraping
- Parser le html (beautiful soup)
- Structurer des données
- Utiliser les expressions régulières pour extraire des données (contenance)
- Enrichir et fusionner des données
- Fusionner deux fichiers sans clé commune
- ELT & ETL
- Gérer les erreurs
- Vérifier la qualité des données
- Gérer les données erronées et absentes
Source mongoStreamlit : https://github.com/Mortafix/streamlit-mongo