Calibration: 一个工业价值极大,学术界却鲜有研究的问题!

极市导读
在实际的工业应用中,当模型的准确性无法达到预期的标准时,通常思考采用提高模型决策的阈值。而这种方法在神经网络上不一定适用。本文介绍了一篇来自2017年的ICML顶会论文,关于让模型的softmax输出能真实的反映决策的置信度,也就是Calibration问题。>>加入极市CV技术交流群,走在计算机视觉的最前沿
神经网络的 overconfidence



预期校准误差(ECE)

什么原因导致神经网络出现准确率与置信度不匹配?



我们该如何对模型进行校准呢?



讨论
模型的置信度应当是和准确率匹配的,这样的模型我觉得才是有意义的,否则以很高置信度进行很离谱的预测错误的模型会让人感觉这个模型好像什么都会、又好像什么都不会。 ECE 的指标是否能反应样本的一些性质,例如难易程度、是否为噪声等。 该文章是间接的去优化ECE的,能否有直接优化的形式,或者主动学习里面能否考虑这一点来挑选样本?
推荐阅读

评论