word2vec
使用20W财经新闻训练得到的词向量,主要用于金融概念词识别。
工具:Gensim
示例:
“概念股”最相近词语:
概念 0.828730583190918
题材 0.7935951352119446
龙头股 0.7753161191940308
题材股 0.7550100088119507
板块 0.7369766235351562
雄安股 0.7320193648338318
个股 0.7211922407150269
次新股 0.7193111181259155
妖股 0.7112669944763184
地产股 0.6996505856513977
“大盘”最相近词语:
上证指数 0.8696824908256531
股指 0.7608878016471863
行情 0.7578240633010864
大盘走势 0.7573873996734619
沪综指 0.7557107210159302
短线 0.7531182765960693
创指 0.7396936416625977
缩量 0.7333449125289917
创业板 0.7100648880004883
权重股 0.7078626155853271
"央行"最相近词语:
日本央行 0.7546145915985107
公开市场 0.7421003580093384
欧洲央行 0.7178292274475098
降准 0.7176886796951294
中央银行 0.7170150279998779
货币政策 0.7151328921318054
OMO 0.7060177326202393
央妈 0.7032131552696228
人民银行 0.702327311038971
MLF 0.6819354891777039