Lab 3: 3.1 #23

foivospar · 2020-01-21T15:20:23Z

Στο μηχανισμό προσοχής SelfAttention που μας δίνεται, το όρισμα attention_size που δίνεται κατά τη δημιουργία του μηχανισμού πόσο πρέπει να είναι? Ίσο με το MAX_LENGTH των προτάσεων?

georgepar · 2020-01-21T15:37:15Z

Για αυτο πρέπει να σκεφτείς τι κάνει αυτός ο μηχανισμός προσοχής.

Θες ένα δίκτυο (στην περίπτωση σου ένα feedforward network) να προβλέψει ένα βάρος a_i για κάθε token στην πρόταση, ώστε να μπορέσεις να πάρεις την τελική αναπαράσταση h=a1 * h1 + a2 * h2 + ....
Συνεπώς το attention θα πρεπει να γυρίζει ΜΑΧ_LENGTH βάρη.
Το ενδιαφέρον είναι τι κάνεις για να μη δώσεις βάρη στα padded elements, για το οποίο θα έλεγα να δεις τι κάνει ο κώδικας του attention εδω: https://gist.github.com/cbaziotis/94e53bdd6e4852756e0395560ff38aa4#file-selfattention-py-L43

foivospar · 2020-01-21T16:17:27Z

Ναι κατάλαβα, είναι στην ουσία η διάσταση των αναπαραστάσεων των εισόδων ? Π.χ. για το ερώτημα 3.1 η διάσταση των embeddings. Γιατί το έτρεξα έτσι και δούλεψε.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lab 3: 3.1 #23

Lab 3: 3.1 #23

foivospar commented Jan 21, 2020

georgepar commented Jan 21, 2020

foivospar commented Jan 21, 2020

Lab 3: 3.1 #23

Lab 3: 3.1 #23

Comments

foivospar commented Jan 21, 2020

georgepar commented Jan 21, 2020

foivospar commented Jan 21, 2020