Skip to content

DiploDatos/AprendizajeNOSupervisado

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AprendizajeNOSupervisado 2022

Curso de Aprendizaje NO Supervisado DiploDatos

Valeria Rulloni, Laura Alonso Alemany

Archvos de clases en: https://drive.google.com/drive/folders/1qJ8cYKJz_0-j-f-zvvr9RWFGLRj3H35L

Contenidos:

  • Clustering
  • Embeddings
  • Aprendizaje Semi-Supervisado
  • Reglas de Asociación

Práctico entregable: Utilizar la base de jugadores “players_22.csv” disponible en la página de Kaggle https://www.kaggle.com/datasets/stefanoleone992/fifa-22-complete-player-dataset . Considerar que la base 2022 no tiene el mismo formato que la base vista en clase, a los nombres de las variables se les agregó una keyword para identificar a qué tipo de habilidad corresponde.

Con la nueva base, realizar un análisis análogo al que realizamos en el cursado de la materia con los datos FIFA2019. Realice comentarios en cada parte (verbose=True ;))

1- Análisis exploratorio de la base. 2- Evaluación visual e intuitiva de a dos variables numéricas por vez. 3- Uso de dos técnicas de clustering: por ejemplo k-medias, DBSCAN, mezcla de Gaussianas y/o alguna jerárquica. Elección justificada de hiper-parámetros 4- Evaluación y Análisis de los clusters encontrados. 5- Pregunta: ¿Se realizó alguna normalización o escalado de la base? ¿Por qué ? 6- Uso de alguna transformación (proyección, Embedding) para visualizar los resultados y/o usarla como preprocesado para aplicar alguna técnica de clustering.

About

Curso de Aprendizaje NO Supervisado

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •