Skip to content

collab-uniba/Progetto-Tesi-Balzano

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Rilevamento automatico delle emozioni mediante dati raccolti da dispositivi indossabili

Riconoscimento automatico delle emozioni attraverso la classificazione di valenza e attivazione e l'analisi di segnali biometrici catturati dal dispositivo Empatica E4 wristband.

I dati utilizzati appartengono allo studio "Introducing wesad, a multimodal dataset for wearable stress and affect detection." di Schmidt et al.

Vengono utilizzati due approcci differenti: modelli di Classic Machine Learning (CML) e modello di Deep Learning transformer.

Configurazione

Una volta scaricato il repository, estrarre l'achivio WESAD, contenente i dati biometrici e i valori di valenza e attivazione necessari alla task di classificazione. La cartella ottenuta deve chiamarsi "WESAD" e deve contenere al suo interno 15 cartelle chiamate con numeri da 1 a 15 corrispondenti ai 15 soggetti del dataset.

Prima di poter classificare mediante i modelli CML o con il transformer, è necessario effettuare il preprocessing dei dati. Il preprocessing crea i segmenti di dati di input per il transformer ed estrae le feature di input per i modelli CML.

Preprocessing dei dati

Aprire il prompt dei comandi nella cartella principale del repository.

Creare l'ambiente virtuale:

python -m venv preprocessing

Installare le librerie necessarie al preprocessing:

pip install -r preprocessing/requirements.txt

Eseguire il preprocessing:

python preprocessing/main.py --segmentation_window_size 60 --segmentation_step_size 10 --neutral_range 0.2

I parametri utilizzabili sono i seguenti:

  • segmentation_window_size: dimensione della finestra di segmentazione (secondi). Valori possibili: [30, 60, 120], valore consigliato: 60.
  • segmentation_step_size: dimensione del passo di segmentazione (secondi). Valori possibili: [5, 10, 15], valore consigliato: 10.
  • neutral_range: range dalla media delle etichette neutral. Valori possibili: [0.2, 0.35, 0.5], valore consigliato: 0.2. Non utilizzare il valore 0.5 se si vuole classificare con il modello transformer con split dei dati per soggetto in quanto si generano troppi segmenti neutral.

Classificazione con modelli CML

Aprire il prompt dei comandi nella cartella principale del repository.

Creare l'ambiente virtuale:

python -m venv CML

Installare le librerie necessarie:

pip install -r CML/requirements.txt

Prima di ottimizzare gli iperparametri, o classificare direttamente, bisogna estrarre le features dai dati con il seguente comando:

python CML/feature_extraction.py

Questo comando non necessita di alcun parametro.

Una volta eseguito il comando, verrà creato un file chiamato "features.csv" che verrà utilizzato per l'ottimizzazione degli iperparametri o per la classificazione. Non è necessario ripetere il comando per ogni ottimizzazione o classificazione se il file è stato già creato.

Ottimizzazione degli iperparametri (opzionale)

Eseguire il seguente comando per ottenere i migliori iperparametri per un determinato modello e una determinata etichetta:

python CML/param_optimization.py --label arousal --model xgb

I parametri utilizzabili sono i seguenti:

  • label: etichetta del quale ottimizzare gli iperparametri. Valori possibili: [valence, arousal]. Default: valence.
  • model: sigla del modello da utilizzare. xgb=XGBoost, knn=kNN, rf=random forest, dt=decision tree. Valori possibili: [xgb, knn, rf, dt]. Default: xgb.

Classificazione

Eseguire il seguente comando per classificare con un determinato modello, etichetta e metodo di split:

python CML/main.py --label valence --model xgb --split_type LOSO --xgb_max_depth 3 --xgb_n_estimators 50 --xgb_learning_rate 0.01

I parametri utilizzabili sono i seguenti:

Parametri di classificazione:

  • label: etichetta da classificare. Valori possibili: [valence, arousal] Valore di default: valence.
  • model: sigla del modello da utilizzare. xgb=XGBoost, knn=kNN, rf=random forest, dt=decision tree. Valori possibili: [xgb, knn, rf, dt]. Default: xgb.
  • split_type: sigla tipo di split dei dati. LOSO=Leave One Subject Out, L2SO, L3SO=Leave 2, 3 subjects out, KF5, KF10=K-Fold Cross Validation k=5, 10. Valori possibili: [xgb, knn, rf, dt]

Parametri modello XGBoost:

  • xgb_max_depth: profondita' massima. Valori possibili: [3, 5, 10, 20, 30], default: 3.
  • xgb_n_estimators: numero di alberi da valutare. Valori possibili: [50, 100, 200], default: 50.
  • xgb_learning_rate: tasso apprendimento. Valori possibili: [0.01, 0.1, 0.3, 0.5], default: 0.01.

Parametri modello kNN:

  • knn_n_neighbors: numero di vicini. Valori possibili: [1, 3, 5, 7, 9, 11, 13, 15], default: 3.
  • knn_weights: metodo di peso dei vicini. Valori possibili: [uniform, distance], default: uniform.
  • knn_metric: metrica per calcolare la distanza. Valori possibili: [euclidean, manhattan, minkowski], default: manhattan.

Parametri modelli Random Forest:

  • rf_max_depth: profondita' massima. Valori possibili: [None, 10, 20, 30], default: 30.
  • rf_n_estimators: numero di alberi da valutare. Valori possibili: [50, 100, 200], default: 50.
  • rf_min_samples_split: numero minimo di campioni richiesti per dividere un nodo interno. Valori possibili: [2, 5, 10], default: 10.
  • rf_min_samples_leaf: numero minimo di campioni che deve avere un nodo foglia. Valori possibili: [1, 2, 4], default: 1.

Parametri modello Decision Tree:

  • dt_max_depth: profondita' massima. Valori possibili: [None, 10, 20, 30], default: 30.
  • dt_min_samples_split: numero minimo di campioni richiesti per dividere un nodo interno. Valori possibili: [2, 10, 20], default: 10.
  • dt_min_samples_leaf: numero minimo di campioni che deve avere un nodo foglia. Valori possibili: [1, 5, 10], default: 1.
  • dt_criterion: funzione di misurazione qualita' di una divisione. Valori possibili: [gini, entropy], default: gini.
  • dt_splitter: strategia di scelta della divisione. Valori possibili: [best, random], default: random.

Inserire parametri non relativi al modello scelto non ha alcun effetto.

Classificazione con trivial classifier

Per eseguire la classificazione mediante trivial classifier per una determinata etichetta eseguire il seguente comando:

python CML/trivial_classifier.py --label valence

I parametri utilizzabili sono i seguenti:

  • label: etichetta da classificare. Valori possibili: [valence, arousal] Valore di default: valence.

Classificazione con transformer

Aprire il prompt dei comandi nella cartella principale del repository.

Creare l'ambiente virtuale:

python -m venv DL

Installare le librerie necessarie:

pip install -r DL/requirements.txt

Ottimizzazione degli iperparametri (opzionale)

Eseguire il seguente comando per ottenere i migliori iperparametri del transformer:

python DL/param_optimization.py --label arousal --num_optimization_trials 20 --num_optimization_epochs 20

I parametri utilizzabili sono i seguenti:

  • label: etichetta del quale ottimizzare gli iperparametri. Valori possibili: [valence, arousal]. Default: valence.
  • num_optimization_trials: numero di tentativi di ottimizzazione iperaparametri. Default: 20.
  • num_optimization_epochs: numero di epoche per trial di ottimizzazione iperparametri. Default: 20

Il risultato dell'ottimizzazione è salvato in un file in formato ".csv" nella cartella "DL/sessions" con il nome "< label >_ optimization _ < data e ora di inizio > .csv"

Classificazione

Eseguire il seguente comando per classificare con il transformer per una determinata etichetta:

python DL/classification.py --label arousal --split_type LOSO --num_epochs 500

I parametri utilizzabili sono i seguenti:

Parametri di classificazione:

  • label: etichetta da classificare. Valori possibili: [valence, arousal]. Default: valence.
  • split_type: tipo di split dei dati in train/val/test. Valori possibili: [LOSO, L2SO, L3SO, segment]. LOSO=Leave One Subject Out, L2SO, L3SO=Leave 2, 3 subjects out, segment=split per segmento. Default: segment.
  • val_ratio: rapporto dello split set di validazione (solo per split di tipo segment). Default: 15.
  • test_ratio: rapporto dello split set di test (solo per split di tipo segment). Default: 15.
  • num_epochs: numero di epoche di addestramento. Default: 500.
  • num_epochs_to_save: numero di epoche per salvataggio automatico info sessione su file. Default: 25.

Parametri di ottimizzatore e scheduler:

  • learning_rate: tasso di apprendimento iniziale. Default: 0.0001.
  • patience: numero di epoche di pazienza senza miglioramento. Default: 10.
  • max_lr_reductions: numero di massimo di riduzioni del learning rate. Default: 3.
  • factor: fattore di riduzione del learning rate. Default: 0.3.
  • threshold: soglia di tolleranza non miglioramento. Default: 0.001.

Parametri modello:

  • batch_size: numero di segmenti di un batch. Valori possibili: [16, 32, 64, 128, 256]. Default: 256.
  • d_model: dimensione interna del modello. Valori possibili: [32, 64, 128, 256]. Default: 64.
  • dim_feedforward: dimensione feedforward network. Valori possibili: [128, 256, 512, 1024, 2048]. Default: 256.
  • dropout: percentuale spegnimento neuroni. Valori possibili: [0.1, 0.15, 0.2, 0.25, 0.3, 0.4, 0.5]. Default: 0.25.
  • num_heads: numero di teste modulo auto-attenzione. Valori possibili: [2, 4, 8]. Default: 2.
  • num_layers: numero di livelli dell'encoder. Valori possibili: [2, 3, 4, 5, 6]. Default: 3.
  • pe_type: tipo di positional encoding. Valori possibili: [fixed, learnable]. Default: learnable.

Il risultato della classificazione è salvato in un file in formato ".csv" nella cartella "DL/sessions" con il nome "< label >_ classification _ < data e ora di inizio > .csv"

Autore

Michelangelo Balzano, Università degli studi di Bari Aldo Moro, [email protected]

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages