-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathindex.qmd
107 lines (56 loc) · 4.92 KB
/
index.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
---
title: "Preprocessament i Modelatge Avançat d'Anàlisi de Dades (PMAAD)"
toc: true
number-sections: true
---
**Preprocessament i models avançats d'anàlisis de dades** és la tercera assignatura d'una seqüència on s'han adquirit ja els rudiments de Probabilitat i Estadística que inclou *Introducció a l'Estadística* (IE, Quadrimestre 2) i els *Models estadístics més bàsics* (ME, Quadrimestre 3). En aquestes assignatures prèvies, l'estudiant de grau de IA ha pogut aprendre nocions bàsiques d'anàlisi exploratòria i descriptiva de dades, teoria de probabilitat i mostreig, nocions d'inferència estadística i disseny d'experiments i models lineals de regressió simple, respectivament. Mentre que, a Modelització estadística, s'introdueix a l'alumne en models més complexos que inclouen, d'una banda, models de classificació, model lineal general i generalitzat i una introducció a sèries temporals com a algorismes supervisats, i, d'altra banda, models no supervisats que inclouen *clustering* i tècniques d'anàlisi multivariant del tipus *PCA.*
En aquesta assignatura es treballarà la metodologia de preprocessament de dades des d'una perspectiva de sistematització del procés i abordatge d'escenaris més complexos, dades composicionals, variables multivaluades, dades multilingües, ... i s'estudiaran mètodes més complexos d'imputació de dades mancants o de diagnòstic i tractament d'outliers que permetin portar la dada a la presa de decisions complexes en aplicacions reals.
Aquesta assignatura integrarà les tècniques més complexes de preprocessament de dades en un escenari genèric de ciència de dades per connectar les dades depurades a models ja sigui d'estadística multivariant, com d'aprenentatge automàtic.
Respecte als mètodes avançats d'anàlisi de dades, es veuran tècniques d'anàlisi multivariant noves, com les que permeten escalar el clustering jeràrquic, noves formes de representar les dades (variables semàntiques) o generalitzen la topologia de classes que es poden reconèixer i l'automatització del postprocessament de dades, que ajuda a interpretar els patron representants en les classes. D'altra banda, s'exploraran diferents tècniques d'estadística multivariant per tractar dades espai-temporals i textuals, així com l'extracció de topics.
[Introducció de l'assignatura](material/2425PresentacioCurs.qmd)
## Advanced Preprocessing
### Basic Imputation methods
[Basic Imputation method](material/01_AdvancedPreprocessing/teoria/basicImputation.qmd)
[Lab sesion 1 - Basic Imputation method](material/01_AdvancedPreprocessing/laboratorio/)
### Outliers Multivariates
[Outiliers Multivariates](material/01_AdvancedPreprocessing/teoria/)
[Lab sesion 2 - Outliers Multivariates](material/01_AdvancedPreprocessing/laboratorio/)
### *MICE/MIMMI/CURE*
[Advanced Imputation Methods](material/01_AdvancedPreprocessing/teoria/)
[Lab sesion 3 - MICE/MIMMI/CURE](material/01_AdvancedPreprocessing/laboratorio/)
## Advanced Clustering
### DBSCAN/OPTICS
[DBSCAN](material/02_AdvancedClustering/teoria/)
[OPTICS](material/02_AdvancedClustering/teoria/)
[Lab sesion 4 - DBSCAN/OPTICS](material/02_AdvancedClustering/laboratorio/)
### Times Series Clustering
[Times Series Clustering](material/02_AdvancedClustering/teoria/)
[Lab sesion 5 - Times Series Clustering](material/02_AdvancedClustering/laboratorio/)
## Advanced Profiling
[Advanced Profiling](material/03_AdvancedProfiling/teoria/)
[Lab sesion 6 - TLP, TERMOMETRO, aTLP](material/03_AdvancedProfiling/laboratorio/)
## Correspondence Analysis
### Simple Correspondence Analysis (ACS)
[ACS](material/04_CorrespondenceAnalysis/teoria/)
[Lab sesion 7 - ACS](material/04_CorrespondenceAnalysis/laboratorio/ACS.qmd)
### Multiple Correspondence Analysis (ACM) and Factor Analysis of mixed data (FAMD)
[ACM](material/04_CorrespondenceAnalysis/teoria/)
[FAMD](material/04_CorrespondenceAnalysis/teoria/)
[Lab sesion 8 - ACM](material/04_CorrespondenceAnalysis/laboratorio/)
[Lab sesion 8 - FAMD](material/04_CorrespondenceAnalysis/laboratorio/FAMD.qmd)
## Geospatial Analysis
### Geovisualitzation
[Geovisualitzation](material/05_GeospatialAnalysis/teoria/)
[Lab sesion 9 - Geovisualitzation](material/05_GeospatialAnalysis/laboratorio/)
### Geostatatistica
[Geostatatistica](material/05_GeospatialAnalysis/teoria/)
[Geomodelling](material/05_GeospatialAnalysis/teoria/)
[Lab sesion 10 - Geostatistica](material/05_GeospatialAnalysis/laboratorio/)
[Lab sesion 11 - Geomodelling](material/05_GeospatialAnalysis/laboratorio/)
## Texual Analysis
### *Topic Modelling*
[Topic Modelling](material/06_TextualAnalysis/teoria/)
[Lab sesion 12 - Topic Modelling](material/06_TextualAnalysis/laboratorio/)
### *Latent Semantic Analysis*
[Latent Semanitc Analysis](material/06_TextualAnalysis/teoria/)
[Lab sesion 13 - LDA](material/06_TextualAnalysis/laboratorio/)