关于PMI PMI, 是互信息(NMI)中的一种特例, 而互信息, 是源于信息论中的一个概念,主要用于衡量2个信号的关联程度. 至于PMI,是在文本处理中,用于计算两个词语之间的关联程度. 比起传统的相似度计算, pmi的好处在于,从统计的角度发现词语共现的情况来分析出词语间是否存在语义相关 , 或者主题相关的情况. tokenizer 表示自己切词 修改了结巴切词