forked from javagose/ENSAHCreditScoring
-
Notifications
You must be signed in to change notification settings - Fork 0
/
GCD5_randomForest_Methods.R
46 lines (39 loc) · 1.53 KB
/
GCD5_randomForest_Methods.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
# ce projet est réaliser par une équipe de ENSA Hoceima (Maroc)
# l'équipe de projet : Walid Benjehd, Med Benyakoub, Abdallah Qesmoun
# set the work directory
setwd("C:/Users/WalidBenjehd/Documents/R/project")
# check the work directory
getwd()
#lire les données complete 1000 lignes
DF.data <-read.csv("R/project/german_credit.csv",header = TRUE, sep=",")
#lire a sample (proportion) des données 98 lignes
View(DF.data)
#Random sample of 50% of row numbers created
indexes = sample(1:nrow(DF.data), size=0.5*nrow(DF.data))
#training data contient les données indexé par indexes
train50 <- DF.data[indexes,]
#test data contient le rest
test50 <- DF.data[-indexes,]
#Random sample of 50% of row numbers created
indexes = sample(1:nrow(DF.data), size=0.5*nrow(DF.data))
#training data contient les données indexé par indexes
train50 <- DF.data[indexes,]
#test data contient le rest
test50 <- DF.data[-indexes,]
#si le data Frame est est fixé alors les noms de colonnes peuvent être directement appelés
attach(DF.data)
#install le packge randam forest
install.packages(randomForest)
library(randomForest)
#appliqué la methode randomforest pour obtenir le module predicté
rf50 <- randomForest(Creditability ~., data = train50, ntree=200, importance=T, proximity=T)
#affiche le plot trees/errors
plot(rf50, main="")
#gerenre la prediction
Test50_rf_pred <- predict(rf50, test50, type="class")
#affiche le tableau
table(Test50_rf_pred, test50$Creditability)
#affiché l'imprtance des vars predicté
importance(rf50)
#affiché le plot
varImpPlot(rf50, main="", cex=0.8)