-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Hỏi hướng dẫn train model mới #44
Comments
@anhtuanvn Hiện tại underthesea có cung cấp một số source code để bạn có thể huấn luyện mô hình mới như tách từ (undertheseanlp/word_tokenize), gán nhãn từ loại (undertheseanlp/pos_tag), ... Bạn có thể tham khảo các project khác ở đây https://github.com/undertheseanlp |
Hi anh, em có tham khảo dự án underthesea và thấy rất hữu dụng. |
Cập nhật 10/11/2020: @anhtuanvn @vukhanh1202 Mình đang cố gắng thực hiện giải quyết issue này, các bạn theo dõi tại (⚗️-2) nhé. Tuy nhiên, hiện tại underthesea đang sử dụng bộ dữ liệu VLSP2013-WTK và VLSP2013-POS (hai bộ dữ liệu này underthesea không có quyền chia sẻ) để huấn luyện mô hình tách từ và gán nhãn từ loại. Để thực sự giải quyết issue này, mình đang nghĩ sẽ chuẩn bị một bộ dữ liệu mở cho 2 task này (chất lượng không bằng bộ chuẩn từ VLSP) |
Chào bạn,
Mình quan tâm tới dự án của các bạn vì nó cho phép train 1 model mới. Tuy nhiên, mình chưa hiểu rõ cách tạo tập train.txt như thế nào để đưa vào huấn luyện model.
Mình nhờ bạn gửi giúp mình hướng dẫn sử dụng chi tiết hơn, đặc biệt về cách train 1 model mới (tạo tập train.txt).
Cảm ơn bạn nhiều!
Best regards
The text was updated successfully, but these errors were encountered: