g-mean 评价指标
g-mean是一种综合评价指标,通常用于评价二分类或多分类问题中的分类器性能。g-mean 是 geometric mean 的缩写,也就是几何平均数的意思。
在二分类问题中,考虑分类器的真阳性率(TPR)和真阴性率(TNR),即分类器正确识别正类样本的能力和正确识别负类样本的能力。在这种情况下,g-mean 定义为 TPR 和 TNR 的几何平均值。 $$
g-mean = sqrt{TPR times TNR} $$
在多分类问题中,可以使用宏平均(macro-average)或微平均(micro-average)来计算 g-mean。宏平均是对每个类别的 g-mean 进行简单平均,而微平均是对所有类别的 TP、TN、FP 和 FN 计算总和,并根据总和计算 g-mean。通常情况下,微平均的结果更加重要,因为它对每个样本的影响相等。
g-mean 是一个很有用的指标,因为它比简单的分类准确率更能够反映分类器在处理不平衡数据集时的性能。当数据集中正类和负类样本数量相差很大时,分类器可能会出现偏差,而 g-mean 能够更好地反映这种偏差。
因此,在评估分类器的性能时,g-mean 是一个非常有用的指标,特别是对于不平衡数据集的分类问题。
- 1 -