-
Notifications
You must be signed in to change notification settings - Fork 0
/
classe_0.Rmd
217 lines (110 loc) · 5.36 KB
/
classe_0.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
---
title: "Curs d'introducció a R"
subtitle: "Classe 0: Què és R"
author: "Eudald Correig i Fraga"
date: "`r format(Sys.time(), '%d de %B de %Y')`"
output: ioslides_presentation
---
# Estructura del curs
## Classe 0: Què és R
\bgroup
\hypersetup{linkcolor = red}
\listoffigures
\egroup
- Detalls del curs
- Descarregar i instal·lar R
- Descarregar i instal·lar RStudio
- Què és R
- Què és i com s'utilitza RStudio
## Classe 1: Introducció a R
- Objectes de R: vectors, matrius, llistes i dataframes
- Operacions en R
- Instal·lació de paquets i llibreries.
- Importació/ Exportació de dades.
- Operacions habituals de tractament de dades.
- Gràfics simples
## Classe 2: Markdown
- Markdown
- Espais de treball
## Classe 3: Estadística bàsica
- Test d'hipòtesi
- Implementació en R
## Classe 4: Errors i missings
- Identificació i tractament d'errors
- Identificació i tractament de missings
## Classe 5: Models predictius
- Regressió lineal
- Regressió logística
- Avaluació de models
- Corbes ROC i AUC
## Classe 6: Selecció de model
- Bias-variance tradeoff
- Overfitting i underfitting
- Forward subset selection
- Lasso
## Classe 7: Gràfics
- Utilització de ggplot2
# Classe 0
## Fonts test d'hipòtesi
La part de test d'hipòtesi no la cobreixen, aquesta està basada en el llibre:
> Statistics, An introduction using R, de Michael J. Crawley i que podeu trobar a la biblio
Tant en els llibres com en els vídeos hi ha moltíssima més informació de la que farem en el curs i és un lloc fantàstic pels que vulguin ampliar.
Un altre llibre que us pot interessar és "Discovering Statistics Using R", de Andy Field i altres. Es un molt bon compendi i un lloc d'on treure llibreries útils.
## Fonts models predictius
Aquesta classe està basada en les classes de Trevor Hastie i Rob Tibshirani (Stanford University) i en el llibre "An Introduction to Statistical Learning with Applications in R"
Podeu trobar les classes aquí:
https://www.r-bloggers.com/in-depth-introduction-to-machine-learning-in-15-hours-of-expert-videos/
I el llibre està penjat gratuïtament aquí (també és a la biblioteca):
http://www-bcf.usc.edu/~gareth/ISL/
## Fonts models predictius
De totes les classes que hi ha, farem:
- Lab: Introduction to R del capítol 2
- Lab: Linear Regression
- Lab: Logistic Regression dels capítols 3 i 4)
- Lab: Forward Stepwise Selection and Model Selection Using Validation Set (tema 6)
- Lab: Model Selection Using Cross-Validation (tema 6)
- Evidentment també són útils les parts teòriques relacionades amb les pràctiques dels vídeos
## Obtenir informació i ajuda
Llocs on treure informació sobre llibreries, tutorials o demanar ajuda:
**Tutorials**: https://www.statmethods.net/index.html, https://www.r-bloggers.com
**Documentació**: https://cran.r-project.org/manuals.html
**LLibreries** (exemple): https://cran.r-project.org/web/packages/lme4/lme4.pdf
**Demanar ajuda**: https://stackoverflow.com (prgramar)
**Demanar ajuda**: https://stats.stackexchange.com/ (estadística)
Per qualsevol altra cosa, google.
Aquesta classe la podeu trobar actualitzada a
> https://github.com/ecorreig/Curs-R
## Introducció
- R és un potent i flexible programari pensat per tractar dades, fer gràfics i anàlisis estadístics.
- També és un llenguatge de programació amb funcions orientades a objectes.
- És programari lliure i funciona sota Windows, MAC OS i Linux.
## Baixar i instal·lar R
R és un llenguatge de programació, però s'instal·la a l'ordinador com qualsevol altre programa.
El podeu trobar a:
> https://cran.r-project.org/
On trobareu versions per linux, mac i windows.
Baixeu-vos l'última versió disponible, que en el moment d'escriure aquest text és la 3.6.0.
Seguiu després les instruccions per instal·lar-lo al vostre ordinador.
## RStudio
Una vegada instal·lat R ja el podem utilitzar, el que passa és que és difícil d'utilitzar com a tal, i per això fem servir un IDE (Entorn integrat de desenvolupament (en anlgès)), que bàsicament ens facilita la vida a l'hora de programar
L'IDE més utilitzat per R és RStudio, i és el que nosaltres utilitzarem. El podeu trobar a:
**mac**: https://medium.com/@GalarnykMichael/install-r-and-rstudio-on-mac-e911606ce4f4
**Windows**: https://medium.com/@GalarnykMichael/install-r-and-rstudio-on-windows-5f503f708027
**LINUX**: https://medium.com/@GalarnykMichael/install-r-and-rstudio-on-ubuntu-12-04-14-04-16-04-b6b3107f7779
Seguiu també les instruccions per instal·lar-lo.
## ![](input/RStudio-Ball.png){ width=7% } Studio
![](input/RStudio2.png)
## Codificacions (encodings)
- A vegades, sobre tot en Windows, quan obrim un fitxer no es veuen bé els accents.
- Això és a causa de les codificacions, és a dir, com el sistema interpreta els números i lletres.
- En cas de que, en obrir un fitxer, no s'us vegin bé els accents, heu de fer el següent:
- Apreteu a File -> Reopen with encoding -> UTF-8.
- Si tot i així no es veu bé, feu: File -> Reopen with encoding -> Show all encodings -> LATIN1.
## Llibreries i funcions útils en R
En aquests links podeu trobar tant llibreries com funcions en R que us podem ajudar:
- Llibreries: https://support.rstudio.com/hc/en-us/articles/201057987-Quick-list-of-useful-R-packages
- Funcions http://www.sr.bham.ac.uk/~ajrs/R/r-function_list.html
## Fi
\center
\Large
Final de la classe 0.