Cet atelier est présenté dans le cadre de l'événement R à Québec 2019. Ce dépôt servira de base pour que les participants puissent développer leurs programmes.
Pour l'atelier, nous demandons d'avoir les logiciels suivants:
Pour l'installation de Docker sur Windows, une version professionnelle de Windows 10 est nécessaire. Si vous n'êtes pas en mesure de l'installer, nous trouverons une autre alternative le jour de l'événement.
Nous demandons également d'avoir la liste de packages R suivants d'installés avant la journée de l'événement:
- sf
- data.table
- lubridate
- scales
- ggplot2
- caret
- jsonlite
- glmnet
- xgboost
- magrittr
- dplyr
- tibble
- rgdal
- leaflet
- stringi
- purrr
- plotly
- class
- plumber
- opencpu
Notez que certains de ces packages peuvent demander des installations de librairies de système. Voir les documentations des packages au besoin.
Nous vous recommendons de partir de cette structure pour les programmes que vous allez développer durant l'atelier. Pour télécharger le dépôt, vous pouvez cliquer sur le bouton "Clone or download" et sur "Download ZIP" pour télécharger le contenu sur votre ordinateur.
Pour ceux qui sont familiers avec Git, vous pouvez cloner le dépot:
git clone https://github.com/dot-layer/atelier-modelisation-rqc2019.git
├── README.md <- Document de haut-niveau pour l'atelier.
│
├── data <- Dossier contenant les données téléchargées localement.
│
├── models <- Dossier contenant les objets sauvegardés lors de l'entraînement.
│
├── src <- Codes source utilisé dans le projet.
│ │
│ ├── extraction <- Codes source qui font l'extraction et la collecte de données.
│ │
│ ├── exploration <- Codes source qui font l'exploration des données.
│ │
│ ├── pretraitements <- Codes source qui font le prétraitements des données.
│ │
│ ├── modelisation <- Codes source qui font l'entraînement et le diagnostic des modèles.
│ │
│ └── deploiement <- Codes source qui font le déploiement du modèle.
│
└── atelier-modelisation-rqc2019.Rproj <- Projet RStudio.