准确率得分#
- sklearn.metrics.accuracy_score(y_true, y_pred, *, normalize=True, sample_weight=None)[source]#
准确率分类评分。
在多标签分类中,此函数计算子集准确率:为样本预测的标签集必须*完全*匹配y_true中相应的标签集。
在用户指南中了解更多信息。
- 参数:
- y_true一维数组类,或标签指示符数组/稀疏矩阵
真实(正确)标签。
- y_pred一维数组类,或标签指示符数组/稀疏矩阵
预测标签,由分类器返回。
- normalize布尔值,默认值=True
如果
False
,返回正确分类样本的数量。否则,返回正确分类样本的比例。- sample_weight形状为(n_samples,)的数组类,默认值=None
样本权重。
- 返回值:
- score浮点数或整数
如果
normalize == True
,返回正确分类样本的比例(浮点数),否则返回正确分类样本的数量(整数)。当
normalize == True
时,最佳性能为1;当normalize == False
时,最佳性能为样本数量。
另见
balanced_accuracy_score
计算平衡准确率以处理不平衡数据集。
jaccard_score
计算 Jaccard 相似系数得分。
hamming_loss
计算两组样本之间的平均汉明损失或汉明距离。
零一损失
计算零一分类损失。默认情况下,该函数将返回预测不完美的子集的百分比。
示例
>>> from sklearn.metrics import accuracy_score >>> y_pred = [0, 2, 1, 3] >>> y_true = [0, 1, 2, 3] >>> accuracy_score(y_true, y_pred) 0.5 >>> accuracy_score(y_true, y_pred, normalize=False) 2.0
在使用二元标签指示符的多标签情况下
>>> import numpy as np >>> accuracy_score(np.array([[0, 1], [1, 1]]), np.ones((2, 2))) 0.5
图库示例#
绘制分类概率
多类 AdaBoosted 决策树
使用高斯过程分类 (GPC) 进行概率预测
在 cross_val_score 和 GridSearchCV 上进行多指标评估的重要性
在 cross_val_score 和 GridSearchCV 上进行多指标评估的重要性
特征缩放的重要性
改变自训练阈值的影响
使用稀疏特征对文本文档进行分类