GitHub - Pydataman/daguan_information_extraction: “达观杯”文本智能信息抽取挑战赛

比赛链接
官方提供了基于CRF++的baseline，训练很快，线上测试为0.85083
CRF++的模型预测官方提供的corpus.txt，再预测test.txt，效果会好那么一点

基于开源LM-LSTM-CRF，主要对train.py和predictor.py做了修改，线上测试0.842887
很是尴尬，没超过baseline
应该是参数没调好，参数大小都设置的比较小，也没加词向量

可以加glove、fasttext等生成的词向量

😊 整理有点粗忙，可能存在bug，欢迎指出，一起进步

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
model		model
README.md		README.md
pre_data.py		pre_data.py
predict.py		predict.py
train.py		train.py

Provide feedback