Cette formation a été conçue pour initier au Machine Learning, en deux jours, des chefs de projets. Elle s'adresse à des personnes n'ayant pas de connaissance préalable du domaine.
La formation est en langue française.
Cette formation a été initialement créée par Météo-France pour ses salariés, mais elle est parfaitement adaptée à d'autres domaines d'application que la météorologie. Les supports de cours et les codes sources des travaux pratiques sont partagés en open-source dans ce dépôt.
- Connaissances de base en programmation, idéalement en python
- Mathématiques, niveau premier cycle universitaire
La formation alterne cours et travaux pratiques. Elle est prévue pour être suivie dans l'ordre suivant :
- Cours 00 - Programme de la formation
- Cours 01 - Introduction au Machine Learning
- Cours - Notebook 02.1 - Manipulation et description des données
- TP 01 - Python pour Data Scientists Partie 1 Données
- Cours - Notebook 02.2 - Algorithmes de machine learning
- Cours - Notebook 02.3 - Evaluation et sélection de modèles
- TP 01 - Python pour Data Scientists Partie 2 Modélisation
- Cours - Notebook 02.4.1 - Forêts d'arbre aléatoire
- Cours - Notebook 02.4.2 - Clustering - Kmeans
- TP 02 - Reconnaissance de chiffres manuscrits (modèles linéaires, random forest...)
- Cours 02 - Introduction au Deep Learning - Vidéo : https://youtu.be/F3F75xnhG0M (contribuée par Lior Perez)
- Cours 03 - La librairie Keras
- TP 03 - Réseaux convolutionnels : reconnaissance de chiffres manuscrits avec Keras - Vidéo : https://youtu.be/p5HZ5YaCc04 (contribuée par Sirine Hdiji)
- Cours 04 - Réseaux récurrents
Les planches des cours sont au format Markdown, afin d'être aisément modifiables. Une version pdf est également fournie. La version pdf est générée à partir du Markdown avec l'utilitaire Marp :
Les TP sont en Python 3, au format Jupyter Notebook. Pour plus d'informations sur l'installation et l'utilisation de Jupyter Notebook : https://jupyter.org/
Pour l'installation de Python 3 et des librairies scientifiques, nous recommandons Anaconda. Sur ce lien, choisir Python 3.6: https://www.anaconda.com/download/
Les librairies python suivantes sont requises, certaines étant déjà incluses dans Anaconda :
- numpy
- pandas
- sklearn
- tensorflow (nb: la librairie keras est aujourd'hui inclue dans tensorflow)
Dans le dossier de chaque TP, vous trouverez :
- Le TP lui-même, sous la forme d'un notebook Jupyter à compléter,
- La correction du TP.
Les contributions pour améliorer ce cours ou pour le compléter sont bienvenues.
Si vous souhaitez contribuer, plusieurs issues sont déjà ouvertes et attendent votre aide.
Vous pouvez également soumettre des pull requests pour apporter des corrections mineures. Si vous souhaitez apporter des modifications importantes, merci d'ouvrir d'abord une issue.
Contributeurs ayant participé à la création de cette formation : Lior Perez, Simon Moisselin, Valentin Fouqueau, Bruno Pradel
Certains contenus ont été empruntés à d'autres formations. Merci à leurs auteurs :
- Cours de Machine Learning de Stanford par Andrew NG, sur la plateforme Coursera
- Cours de Deep Learning de Stanford University par Fei-Fei Li, Justin Johnson et Serena Yeung
- Scikit-learn Tutorial par Jake VanderPlas
Si vous trouvez des documents non crédités, ou si nous avons involontairement utilisé sans votre accord un contenu vous appartenant, veuillez nous contacter.
If you believe that we have unintentionally used some contents without giving credits or without approval from the authors, please contact us.
Copyright 2018 - Météo-France
Cette formation est partagée par Météo-France sous la licence Apache 2.0.
This content is shared by Météo-France under the Apache 2.0 licence.