sklearn.metrics#

评分函数、性能指标、成对指标和距离计算。

用户指南. 更多详情请参阅指标和评分:量化预测质量成对指标、亲和度和核函数部分。

模型选择接口#

用户指南. 更多详情请参阅评分参数:定义模型评估规则部分。

check_scoring

根据用户选项确定评分器。

get_scorer

从字符串获取评分器。

get_scorer_names

获取所有可用评分器的名称。

make_scorer

从性能指标或损失函数创建评分器。

分类指标#

用户指南. 更多详情请参阅分类指标部分。

accuracy_score

准确度分类分数。

auc

使用梯形规则计算曲线下面积 (AUC)。

average_precision_score

从预测分数计算平均精度 (AP)。

balanced_accuracy_score

计算平衡准确度。

brier_score_loss

计算 Brier 分数损失。

class_likelihood_ratios

计算二元分类的正负似然比。

classification_report

生成显示主要分类指标的文本报告。

cohen_kappa_score

计算 Cohen's kappa:一种衡量注释者间一致性的统计量。

confusion_matrix

计算混淆矩阵以评估分类的准确性。

confusion_matrix_at_thresholds

计算每个分类阈值的二元混淆矩阵项。

d2_brier_score

\(D^2\) 分数函数,Brier 分数解释的比例。

d2_log_loss_score

\(D^2\) 分数函数,log loss 解释的比例。

dcg_score

计算折现累积增益。

det_curve

计算不同概率阈值的检测错误权衡 (DET)。

f1_score

计算 F1 分数,也称为平衡 F 分数或 F-measure。

fbeta_score

计算 F-beta 分数。

hamming_loss

计算平均 Hamming 损失。

hinge_loss

平均铰链损失(非正则化)。

jaccard_score

Jaccard 相似系数分数。

log_loss

Log loss,又名 logistic loss 或交叉熵损失。

matthews_corrcoef

计算 Matthews 相关系数 (MCC)。

multilabel_confusion_matrix

计算每个类别或样本的混淆矩阵。

ndcg_score

计算归一化折现累积增益。

precision_recall_curve

计算不同概率阈值的精确度-召回率对。

precision_recall_fscore_support

计算每个类别的精确度、召回率、F-measure 和支持度。

precision_score

计算精确度。

recall_score

计算召回率。

roc_auc_score

从预测分数计算接收者操作特征曲线下面积 (ROC AUC)。

roc_curve

计算接收者操作特征 (ROC)。

top_k_accuracy_score

Top-k 准确度分类分数。

zero_one_loss

零一分类损失。

回归指标#

用户指南. 更多详情请参阅回归指标部分。

d2_absolute_error_score

\(D^2\) 回归分数函数,绝对误差解释的比例。

d2_pinball_score

\(D^2\) 回归分数函数,pinball loss 解释的比例。

d2_tweedie_score

\(D^2\) 回归分数函数,Tweedie 偏差解释的比例。

explained_variance_score

解释方差回归分数函数。

max_error

max_error 指标计算最大残差。

mean_absolute_error

平均绝对误差回归损失。

mean_absolute_percentage_error

平均绝对百分比误差 (MAPE) 回归损失。

mean_gamma_deviance

平均 Gamma 偏差回归损失。

mean_pinball_loss

分位数回归的 Pinball loss。

mean_poisson_deviance

平均 Poisson 偏差回归损失。

mean_squared_error

均方误差回归损失。

mean_squared_log_error

均方对数误差回归损失。

mean_tweedie_deviance

平均 Tweedie 偏差回归损失。

median_absolute_error

中位数绝对误差回归损失。

r2_score

\(R^2\)(决定系数)回归分数函数。

root_mean_squared_error

均方根误差回归损失。

root_mean_squared_log_error

均方根对数误差回归损失。

多标签排序指标#

用户指南. 更多详情请参阅多标签排序指标部分。

coverage_error

覆盖率误差度量。

label_ranking_average_precision_score

计算基于排名的平均精度。

label_ranking_loss

计算排名损失度量。

聚类指标#

用于聚类分析结果的评估指标。

  • 监督评估使用每个样本的真实类别值。

  • 无监督评估不使用真实值,而是衡量模型本身的“质量”。

用户指南. 更多详情请参阅聚类性能评估部分。

adjusted_mutual_info_score

两个聚类之间的调整互信息。

adjusted_rand_score

经过机会调整的 Rand index。

calinski_harabasz_score

计算 Calinski and Harabasz 分数。

cluster.contingency_matrix

构建描述标签之间关系的列联矩阵。

cluster.pair_confusion_matrix

来自两个聚类的对混淆矩阵。

completeness_score

计算给定地面实况的聚类标签的完整性指标。

davies_bouldin_score

计算 Davies-Bouldin 分数。

fowlkes_mallows_score

衡量一组点的两个聚类的相似性。

homogeneity_completeness_v_measure

同时计算同质性、完整性和 V-measure 分数。

homogeneity_score

给定地面实况的聚类标签的同质性指标。

mutual_info_score

两个聚类之间的互信息。

normalized_mutual_info_score

两个聚类之间的归一化互信息。

rand_score

Rand index。

silhouette_samples

计算每个样本的 Silhouette 系数。

silhouette_score

计算所有样本的平均 Silhouette 系数。

v_measure_score

给定地面实况的 V-measure 聚类标签。

双聚类指标#

用户指南. 更多详情请参阅双聚类评估部分。

consensus_score

两组双聚类的相似性。

距离指标#

DistanceMetric

用于快速距离度量函数的统一接口。

成对指标#

用于样本集的成对距离和亲和度的指标。

用户指南. 更多详情请参阅成对指标、亲和度和核函数部分。

pairwise.additive_chi2_kernel

计算 X 和 Y 中的观测值之间的加性卡方核。

pairwise.chi2_kernel

计算 X 和 Y 之间的指数卡方核。

pairwise.cosine_distances

计算 X 和 Y 中的样本之间的余弦距离。

pairwise.cosine_similarity

计算 X 和 Y 中的样本之间的余弦相似度。

pairwise.distance_metrics

pairwise_distances 的有效指标。

pairwise.euclidean_distances

计算特征数组 X 和 Y 中每对之间的距离矩阵。

pairwise.haversine_distances

计算 X 和 Y 中的样本之间的 Haversine 距离。

pairwise.kernel_metrics

pairwise_kernels 的有效指标。

pairwise.laplacian_kernel

计算 X 和 Y 之间的拉普拉斯核。

pairwise.linear_kernel

计算 X 和 Y 之间的线性核。

pairwise.manhattan_distances

计算 X 和 Y 中向量之间的 L1 距离。

pairwise.nan_euclidean_distances

计算存在缺失值时的欧几里得距离。

pairwise.paired_cosine_distances

计算 X 和 Y 之间的成对余弦距离。

pairwise.paired_distances

计算 X 和 Y 之间的成对距离。

pairwise.paired_euclidean_distances

计算 X 和 Y 之间的成对欧几里得距离。

pairwise.paired_manhattan_distances

计算 X 和 Y 之间的成对 L1 距离。

pairwise.pairwise_kernels

计算数组 X 和可选数组 Y 之间的核。

pairwise.polynomial_kernel

计算 X 和 Y 之间的多项式核。

pairwise.rbf_kernel

计算 X 和 Y 之间的 rbf(高斯)核。

pairwise.sigmoid_kernel

计算 X 和 Y 之间的 sigmoid 核。

pairwise_distances

计算特征数组 X 和可选 Y 的距离矩阵。

pairwise_distances_argmin

计算一个点与一组点之间的最小距离。

pairwise_distances_argmin_min

计算一个点与一组点之间的最小距离。

pairwise_distances_chunked

按块生成距离矩阵,并带有可选的缩减。

绘图#

用户指南. 更多详情请参阅可视化部分。

ConfusionMatrixDisplay

混淆矩阵可视化。

DetCurveDisplay

检测错误权衡 (DET) 曲线可视化。

PrecisionRecallDisplay

精确度-召回率可视化。

PredictionErrorDisplay

回归模型预测误差的可视化。

RocCurveDisplay

ROC 曲线可视化。