比赛链接
官方提供了基于CRF++的baseline,训练很快,线上测试为0.85083
CRF++的模型预测官方提供的corpus.txt,再预测test.txt,效果会好那么一点
基于开源LM-LSTM-CRF,主要对train.py和predictor.py做了修改,线上测试0.842887
很是尴尬,没超过baseline
应该是参数没调好,参数大小都设置的比较小,也没加词向量
-
pre_data.py 是生成训练、验证文件和待预测的测试文件、提交文件,代码很简单
-
train.py 训练下改下pre_data.py生成文件的路径
-
predict.py 生成输出文件,和baseline模型输出文件一样
-
上传遗漏了evaluator.py,这个py文件和原始开源代码里面的一样,加进去即可
😊 整理有点粗忙,可能存在bug,欢迎指出,一起进步