Lab2: Ερώτημα 4.2.2 #7

DominusTea · 2019-12-20T11:50:31Z

Τα n-grams που παράγονται στο ερώτημα αυτό ,μέσω της εντολής build-lm.sh -i <αρχείο lm_train.text> -n <τάξη γλωσσικού μοντέλου> -o <αρχείο_εξόδου.ilm.gz>, σε εμάς περιέχουν και τα κόστη των uttids πέρα από τα κόστη των φωνημάτων. Αυτό είναι κάτι το επιθυμητό ή έχει γίνει κάποιο λάθος στα προηγούμενα βήματα.

njellinas · 2019-12-20T12:13:04Z

Θα πρέπει να περιεχουν μονο τα κοστη των φωνηματων. Μηπως εχεις βαλει καπου στο preprocessing τα utterance ids σε καποιο αρχειο που δεν επρεπε?

Yenn1s · 2019-12-21T10:18:43Z

για να φτιαχτούν χρησιμοποιούμε το αρχείο (πχ) lm_train.text, που είναι ανακατασκευή του αρχείου .text που φτιάχνεται στο preprocessing , στα οποία σε όλα πρέπει να υπάρχει τα utterance ids, οπότε να μην βάλουμε τα utterance ids στο lm_train?
(επίσης δίνεται βάρος και στα < s > και < /s > )

njellinas · 2019-12-30T16:08:36Z

Στο lm_train δε θα πρέπει να υπάρχουν τα utterance ids.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lab2: Ερώτημα 4.2.2 #7

Lab2: Ερώτημα 4.2.2 #7

DominusTea commented Dec 20, 2019

njellinas commented Dec 20, 2019

Yenn1s commented Dec 21, 2019 •

edited

Loading

njellinas commented Dec 30, 2019

Lab2: Ερώτημα 4.2.2 #7

Lab2: Ερώτημα 4.2.2 #7

Comments

DominusTea commented Dec 20, 2019

njellinas commented Dec 20, 2019

Yenn1s commented Dec 21, 2019 • edited Loading

njellinas commented Dec 30, 2019

Yenn1s commented Dec 21, 2019 •

edited

Loading