部分模型的网盘链接: https://pan.baidu.com/s/1c24aKJe 密码: 2s25 参赛说明: 看山杯init解决方案.pdf
下述两个命令可完成环境配置,详细的信息可参照readme.md,另外程序需要在GPU环境中运行.
pip install http://download.pytorch.org/whl/cu80/torch-0.1.12.post2-cp27-none-linux_x86_64.whl
pip -r requirements.txt
从网盘下载的文件包括:
MultiModel*
: 模型保存文件MultiModel*.json
: 对应模型的配置id2label
: 一个长为1999的字典,保存id和label的对应关系test.npz
: 经过预处理之后的测试集. 如果你想手动生成对应的测试集,你可以运行python2 scripts/data_process/question2array.py question_eval.txt test.npz
,数据处理的时候需要用到tensorflow. 把这些文件直接放在当前目录下即可.
python rep.py
如果上述文件被移到另外的地方,需要相应的修改代码中的路径. 程序运行完会得到submission.csv,提交即可计算分数. P.S. 这个只是部分的模型(6个),我们在练习赛排行榜上的分数是0.43531,已然足以夺得public leaderboard第一.
更多关于训练的细节见 readme.md