sklearn.metrics#

评分函数、性能指标、成对指标和距离计算。

用户指南。 更多详细信息请参见指标和评分:量化预测质量成对指标、相似度和核部分。

模型选择接口#

用户指南。 更多详细信息请参见评分参数:定义模型评估规则部分。

check_scoring

根据用户选项确定评分器。

get_scorer

从字符串获取评分器。

get_scorer_names

获取所有可用评分器的名称。

make_scorer

从性能指标或损失函数创建评分器。

分类指标#

用户指南。 更多详细信息请参见分类指标部分。

accuracy_score

准确率分类得分。

auc

使用梯形规则计算曲线下面积(AUC)。

average_precision_score

从预测分数计算平均精度(AP)。

balanced_accuracy_score

计算平衡准确率。

brier_score_loss

计算 Brier 分数损失。

class_likelihood_ratios

计算二元分类的正负似然比。

classification_report

构建一个文本报告,显示主要分类指标。

cohen_kappa_score

计算 Cohen's kappa:衡量标注者间一致性的统计量。

confusion_matrix

计算混淆矩阵以评估分类的准确性。

d2_log_loss_score

\(D^2\) 评分函数,解释的对数损失比例。

dcg_score

计算折损累计增益。

det_curve

计算不同概率阈值下的检测误差权衡 (DET)。

f1_score

计算 F1 分数,也称为平衡 F 分数或 F-measure。

fbeta_score

计算 F-beta 分数。

hamming_loss

计算平均汉明损失。

hinge_loss

平均合页损失(非正则化)。

jaccard_score

Jaccard 相似系数分数。

log_loss

对数损失,又称逻辑损失或交叉熵损失。

matthews_corrcoef

计算 Matthews 相关系数(MCC)。

multilabel_confusion_matrix

计算每个类别或样本的混淆矩阵。

ndcg_score

计算归一化折损累计增益。

precision_recall_curve

计算不同概率阈值下的精确率-召回率对。

precision_recall_fscore_support

计算每个类别的精确率、召回率、F-measure 和支持度。

precision_score

计算精确率。

recall_score

计算召回率。

roc_auc_score

从预测分数计算接收者操作特征曲线下面积(ROC AUC)。

roc_curve

计算接收者操作特征曲线(ROC)。

top_k_accuracy_score

Top-k 准确率分类得分。

zero_one_loss

零一分类损失。

回归指标#

用户指南。 更多详细信息请参见回归指标部分。

d2_absolute_error_score

\(D^2\) 回归评分函数,解释的绝对误差比例。

d2_pinball_score

\(D^2\) 回归评分函数,解释的弹球损失比例。

d2_tweedie_score

\(D^2\) 回归评分函数,解释的 Tweedie 偏差比例。

explained_variance_score

解释方差回归评分函数。

max_error

max_error 指标计算最大残差。

mean_absolute_error

平均绝对误差回归损失。

mean_absolute_percentage_error

平均绝对百分比误差(MAPE)回归损失。

mean_gamma_deviance

平均 Gamma 偏差回归损失。

mean_pinball_loss

分位数回归的弹球损失。

mean_poisson_deviance

平均 Poisson 偏差回归损失。

mean_squared_error

均方误差回归损失。

mean_squared_log_error

均方对数误差回归损失。

mean_tweedie_deviance

平均 Tweedie 偏差回归损失。

median_absolute_error

中位数绝对误差回归损失。

r2_score

\(R^2\) (决定系数) 回归评分函数。

root_mean_squared_error

均方根误差回归损失。

root_mean_squared_log_error

均方根对数误差回归损失。

多标签排序指标#

用户指南。 更多详细信息请参见多标签排序指标部分。

coverage_error

覆盖误差度量。

label_ranking_average_precision_score

计算基于排名的平均精度。

label_ranking_loss

计算排序损失度量。

聚类指标#

聚类分析结果的评估指标。

  • 有监督评估使用每个样本的真实类别值。

  • 无监督评估不使用真实值,而是衡量模型本身的“质量”。

用户指南。 更多详细信息请参见聚类性能评估部分。

adjusted_mutual_info_score

两个聚类间的调整互信息。

adjusted_rand_score

经机会调整的 Rand 指数。

calinski_harabasz_score

计算 Calinski 和 Harabasz 分数。

cluster.contingency_matrix

构建描述标签之间关系的列联矩阵。

cluster.pair_confusion_matrix

两个聚类产生的配对混淆矩阵。

completeness_score

给定真实值,计算聚类标签的完整性指标。

davies_bouldin_score

计算 Davies-Bouldin 分数。

fowlkes_mallows_score

衡量一组点的两个聚类之间的相似性。

homogeneity_completeness_v_measure

一次性计算同质性、完整性和 V-Measure 分数。

homogeneity_score

给定真实值,聚类标签的同质性指标。

mutual_info_score

两个聚类之间的互信息。

normalized_mutual_info_score

两个聚类之间的归一化互信息。

rand_score

Rand 指数。

silhouette_samples

计算每个样本的轮廓系数。

silhouette_score

计算所有样本的平均轮廓系数。

v_measure_score

给定真实值,V-measure 聚类标签。

双聚类指标#

用户指南。 更多详细信息请参见双聚类评估部分。

consensus_score

两组双聚类的相似性。

距离指标#

DistanceMetric

快速距离度量函数的统一接口。

成对指标#

用于样本集之间成对距离和相似度的指标。

用户指南。 更多详细信息请参见成对指标、相似度和核部分。

pairwise.additive_chi2_kernel

计算 X 和 Y 中观测值之间的加性卡方核。

pairwise.chi2_kernel

计算 X 和 Y 之间的指数卡方核。

pairwise.cosine_distances

计算 X 和 Y 中样本之间的余弦距离。

pairwise.cosine_similarity

计算 X 和 Y 中样本之间的余弦相似度。

pairwise.distance_metrics

pairwise_distances 的有效指标。

pairwise.euclidean_distances

计算特征数组 X 和 Y 中每对之间的距离矩阵。

pairwise.haversine_distances

计算 X 和 Y 中样本之间的 Haversine 距离。

pairwise.kernel_metrics

pairwise_kernels 的有效指标。

pairwise.laplacian_kernel

计算 X 和 Y 之间的拉普拉斯核。

pairwise.linear_kernel

计算 X 和 Y 之间的线性核。

pairwise.manhattan_distances

计算 X 和 Y 中向量之间的 L1 距离。

pairwise.nan_euclidean_distances

在存在缺失值的情况下计算欧几里得距离。

pairwise.paired_cosine_distances

计算 X 和 Y 之间成对余弦距离。

pairwise.paired_distances

计算 X 和 Y 之间成对距离。

pairwise.paired_euclidean_distances

计算 X 和 Y 之间成对欧几里得距离。

pairwise.paired_manhattan_distances

计算 X 和 Y 之间成对 L1 距离。

pairwise.pairwise_kernels

计算数组 X 和可选数组 Y 之间的核。

pairwise.polynomial_kernel

计算 X 和 Y 之间的多项式核。

pairwise.rbf_kernel

计算 X 和 Y 之间的 rbf (高斯) 核。

pairwise.sigmoid_kernel

计算 X 和 Y 之间的 Sigmoid 核。

pairwise_distances

从特征数组 X 和可选的 Y 计算距离矩阵。

pairwise_distances_argmin

计算一个点与一组点之间的最小距离。

pairwise_distances_argmin_min

计算一个点与一组点之间的最小距离。

pairwise_distances_chunked

分块生成距离矩阵,并可选地进行降维。

绘图#

用户指南。 更多详细信息请参见可视化部分。

ConfusionMatrixDisplay

混淆矩阵可视化。

DetCurveDisplay

检测误差权衡 (DET) 曲线可视化。

PrecisionRecallDisplay

精确率-召回率可视化。

PredictionErrorDisplay

回归模型的预测误差可视化。

RocCurveDisplay

ROC 曲线可视化。