Skip to content

Latest commit

 

History

History
45 lines (25 loc) · 863 Bytes

README.md

File metadata and controls

45 lines (25 loc) · 863 Bytes

siamese_dssm

v1.0

simaese 判断句子相似度。

v2.0

添加 基于siamese的句子相似度排序,类似于 搜索召回

v3.0

添加 dssm,判断句子相似度

v4.0

dssm和 siamese融合,强化句子相似度排序

目前处于v3.0阶段

入口文件:train.py 执行方式:python train.py 句向量召回测试: infer.py 优化

语料:corpus.txt

所用版本: python=3.5.2 tensorflow=1.3.0

优化方式: 目前已做优化:

    1.余弦距离计算方式完善
    
    2.添加激活函数
    
尚待优化:

    1.更改相似度计算方式及损失函数,余弦距离+方差 改为其他诸如 交叉熵等等;

    2.更改句子向量获取方式,rnn改为cnn;

    3.rnn输出,output或者state作为下一步的变量