Skip to content

Latest commit

 

History

History
36 lines (19 loc) · 677 Bytes

README.md

File metadata and controls

36 lines (19 loc) · 677 Bytes

css-spark-ml(机器学习)

1.推荐模型

1)余弦相似度

2)均方差

3)K值平均准确率

4)MLlib内置函数

2.分类模型

1)预测的正确率和错误率

2)准确率(评价结果的质量)和召回率(评价结果的完整性):[与阈值相关]

3)(准确率-召回率)PR曲线下方的面积:[与阈值相关]

4)ROC曲线:{真阳性率(敏感度):TPR=S(f(1->1))/S(f(1->1)+f(1->0)),假阳性率:FPR=S(f(0->1))/S(f(0->1)+f(0->0))}

5)ROC曲线下的面积(AUC:平均值)

3.回归模型

1)均方误差

2)均方根误差

3)平均绝对误差

4)均方根对数误差

4.聚类模型(无监督学习)

1)K-均值模型