Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Lab2: Ερώτημα 4.2.2 #7

Open
DominusTea opened this issue Dec 20, 2019 · 3 comments
Open

Lab2: Ερώτημα 4.2.2 #7

DominusTea opened this issue Dec 20, 2019 · 3 comments

Comments

@DominusTea
Copy link

Τα n-grams που παράγονται στο ερώτημα αυτό ,μέσω της εντολής build-lm.sh -i <αρχείο lm_train.text> -n <τάξη γλωσσικού μοντέλου> -o <αρχείο_εξόδου.ilm.gz>, σε εμάς περιέχουν και τα κόστη των uttids πέρα από τα κόστη των φωνημάτων. Αυτό είναι κάτι το επιθυμητό ή έχει γίνει κάποιο λάθος στα προηγούμενα βήματα.

@njellinas
Copy link

Θα πρέπει να περιεχουν μονο τα κοστη των φωνηματων. Μηπως εχεις βαλει καπου στο preprocessing τα utterance ids σε καποιο αρχειο που δεν επρεπε?

@Yenn1s
Copy link

Yenn1s commented Dec 21, 2019

για να φτιαχτούν χρησιμοποιούμε το αρχείο (πχ) lm_train.text, που είναι ανακατασκευή του αρχείου .text που φτιάχνεται στο preprocessing , στα οποία σε όλα πρέπει να υπάρχει τα utterance ids, οπότε να μην βάλουμε τα utterance ids στο lm_train?
(επίσης δίνεται βάρος και στα < s > και < /s > )
test

@njellinas
Copy link

Στο lm_train δε θα πρέπει να υπάρχουν τα utterance ids.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants