分类报告#
- sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn')[source]#
构建一个文本报告,显示主要的分类指标。
更多信息请参阅 用户指南。
- 参数:
- y_true一维数组、标签指示符数组或稀疏矩阵
真实目标值。
- y_pred一维数组或标签指示符数组/稀疏矩阵
分类器返回的估计目标。
- labels形状为 (n_labels,) 的数组,默认为 None
可选的标签索引列表,用于包含在报告中。
- target_names形状为 (n_labels,) 的数组,默认为 None
与标签匹配的可选显示名称(顺序相同)。
- sample_weight形状为 (n_samples,) 的数组,默认为 None
样本权重。
- digits整数,默认为 2
格式化输出浮点值的位数。当
output_dict
为True
时,此参数将被忽略,返回的值不会被四舍五入。- output_dict布尔值,默认为 False
如果为 True,则返回字典形式的输出。
版本 0.20 中新增。
- zero_division{"warn", 0.0, 1.0, np.nan},默认为 "warn"
设置当出现零除法时返回的值。如果设置为 "warn",则其作用等同于 0,但也会引发警告。
版本 1.3 中新增: 添加了
np.nan
选项。
- 返回:
- report字符串或字典
每个类别的精确率、召回率和 F1 分数的文本摘要。如果 output_dict 为 True,则返回字典。字典具有以下结构
{'label 1': {'precision':0.5, 'recall':1.0, 'f1-score':0.67, 'support':1}, 'label 2': { ... }, ... }
报告的平均值包括宏平均值(对每个标签的未加权平均值进行平均)、加权平均值(对每个标签的支持加权平均值进行平均)和样本平均值(仅适用于多标签分类)。微平均值(对总真阳性、假阴性和假阳性进行平均)仅在多标签或多类别以及部分类别的情况下显示,因为在其他情况下它对应于准确率,并且所有指标都相同。有关平均值的更多详细信息,另请参见
precision_recall_fscore_support
。请注意,在二元分类中,正类的召回率也称为“灵敏度”;负类的召回率称为“特异性”。
另请参见
precision_recall_fscore_support
计算每个类别的精确率、召回率、F-测度和支持度。
confusion_matrix
计算混淆矩阵以评估分类的准确性。
multilabel_confusion_matrix
为每个类别或样本计算混淆矩阵。
示例
>>> from sklearn.metrics import classification_report >>> y_true = [0, 1, 2, 2, 2] >>> y_pred = [0, 0, 2, 2, 1] >>> target_names = ['class 0', 'class 1', 'class 2'] >>> print(classification_report(y_true, y_pred, target_names=target_names)) precision recall f1-score support class 0 0.50 1.00 0.67 1 class 1 0.00 0.00 0.00 1 class 2 1.00 0.67 0.80 3 accuracy 0.60 5 macro avg 0.50 0.56 0.49 5 weighted avg 0.70 0.60 0.61 5 >>> y_pred = [1, 1, 0] >>> y_true = [1, 1, 1] >>> print(classification_report(y_true, y_pred, labels=[1, 2, 3])) precision recall f1-score support 1 1.00 0.67 0.80 3 2 0.00 0.00 0.00 0 3 0.00 0.00 0.00 0 micro avg 1.00 0.67 0.80 3 macro avg 0.33 0.22 0.27 3 weighted avg 1.00 0.67 0.80 3
图库示例#
识别手写数字
使用特征脸和 SVM 的人脸识别示例
管道 ANOVA SVM
具有交叉验证的网格搜索的自定义重拟合策略
用于数字分类的受限玻尔兹曼机特征
具有异构数据源的列转换器
标签传播数字主动学习
标签传播数字:演示性能