L’entreprise souhaite développer un modèle de scoring de la probabilité de défaut de paiement du client pour étayer la décision d'accorder ou non un prêt à un client potentiel en s’appuyant sur des sources de données variées (données comportementales, données provenant d'autres institutions financières, etc.).
Web App from Heroku & Sharing Streamlit
L'application répond au cahier des charges suivant :
- Permettre de visualiser le score et l’interprétation de ce score pour chaque client pour une personne non experte en data science.
- Permettre de visualiser des informations descriptives relatives à un client (via un système de filtre).
- Permettre de comparer les informations descriptives relatives à un client à l’ensemble des clients ou à un groupe de clients similaires.
Ngrok a été utilisé pour le développement de l'application en local. Ngrok est un outil qui permet de rendre votre poste de développement web local accessible depuis l'extérieur, via un tunnel sécurisé, depuis une url du type https://azerty.ngrok.io.
pip install pyngrok==4.1.1
Pour ce projet, les données ont été manipulées en Python sur support Jupyter Notebook avec développement de l'app Streamlit. Google Colab a été utilisé pour l'entraînement du modèle en exécution GPU.
- Données Kaggle : Home Credit Default
- Présenter son travail de modélisation à l'oral
- Déployer un modèle via une API dans le Web
- Utiliser un logiciel de version de code pour assurer l’intégration du modèle
- Rédiger une note méthodologique afin de communiquer sa démarche de modélisation
- Réaliser un dashboard pour présenter son travail de modélisation
Si vous n'avez jamais installé Python, alors autant installer directement la distribution Anaconda. Anaconda est donc une distribution Python, faite pour la Data Science.
De cette manière on peut installer Python et ses librairies de Data Science Pandas, Matplotlib, Seaborn, Scipy, Numpy etc… Mais aussi le notebook Jupyter, qui reste incontournable et vivement recommandé! C'est par ici : Anaconda
Si vous souhaitez lancer le projet, il sera nécessaire d'installer Jupyter Notebook sur votre mahcine. La doc. Jupyter est accessible via : Jupyter Documentation
python -m pip install --upgrade pip
python -m pip install jupyter
Pour tester l'installation, vous pouvez taper dans votre console la commande suivante :
jupyter notebook
Pour installer python ainsi que les librairies de Data Science, il est fortement recommandé d'installer la distribution Anaconda.
pip install pandas
pip install matplotlib
pip install numpy
pip install scipy
Installation de Heroku Command Line Interface (CLI) Heroku CLI
$ heroku login
Mise à jour des modifications
$ git add .
$ git commit -am "make it better"
$ git push heroku master